La statistique est l’étude de la collecte de données, leur analyse, leur traitement, l’in- terprétation des résultats et leur présentation afin de rendre les données compréhensibles par tous. C’est à la fois une science, une méthode et un ensemble de techniques.
L’analyse des données est utilisée pour décrire les phénomènes étudiés, faire des prévi- sions et prendre des décisions à leur sujet. En cela, la statistique est un outil essentiel pour la compréhension et la gestion des phénomènes complexes.
Les données étudiées peuvent être de toute nature, ce qui rend la statistique utile dans tous les champs disciplinaires et explique pourquoi elle est enseignée dans toutes les filières universitaires, de l’économie à la biologie en passant par la psychologie et bien sûr les sciences de l’ingénieur. La statistique consiste à :
– Recueillir des données.
– Présenter et résumer ces données.
– Tirer des conclusions sur la population étudiée et d’aider à la prise de décision.
– En présence de données dépendant du temps, nous essayons de faire de la prévision.
1.1 - Vocabulaire
Les statistiques consistent en diverses méthodes de classement des données tels que les tableaux, les histogrammes et les graphiques, permettant d’organiser un grand nombre de données. Les statistiques se sont développées dans la deuxième moitié du XIXe siècle dans le domaine des sciences humaines (sociologie, économie, anthropologie, ...). Elles se sont dotées d’un vocabulaire particulier.
1.1.1 Épreuve statistique
Les statistiques descriptives visent à étudier les caractéristiques d’un ensemble d’ob- servations comme les mesures obtenues lors d’une expérience. L’expérience est l’étape pré- liminaire à toute étude statistique. Il s’agit de prendre "contact" avec les observations. De manière générale, la méthode statistique est basée sur le concept suivant.
Définition 1
L’épreuve statistique est une expérience que l’on provoque.
Exemple 1 (La durée de vie des lampes)
Imaginons le cas suivant : un fabricant d’ampoules électriques ayant le choix entre 4 types de filaments se propose d’étudier l’influence de la nature du filament sur la durée de vie des ampoules fabriquées. Pour ce faire, il va faire fabriquer 4 échantillons d’ampoules identiques, sauf en ce qui concerne le filament, faire brûler les ampoules jusqu’à extinction, puis comparer les résultats obtenus.
1.1.2 Population
En statistique, on travaille sur des populations. Ce terme vient du fait que la démo- graphie, étude des populations humaines, a occupé une place centrale aux débuts de la statistique, notamment au travers des recensements de population. Mais, en statistique, le terme de population s’applique à tout objet statistique étudié, qu’il s’agisse d’étudiants (d’une université ou d’un pays), de ménages ou de n’importe quel autre ensemble sur lequel on fait des observations statistiques. Nous définissons la notion de population.
Définition 2
On appelle population l’ensemble sur lequel porte notre étude statistique. Cet ensemble est noté Ω.
Exemple 2
– On considère l’ensemble des étudiants de la section A. On s’intéresse aux nombre de frères et sœurs de chaque étudiant. Dans ce cas
Ω = ensemble des étudiants.
– Si l’on s’intéresse maintenant à la circulation automobile dans une ville, la po- pulation est alors constituée de l’ensemble des véhicules susceptibles de circuler dans cette ville à une date donnée. Dans ce cas
Ω = ensemble des véhicules.
1.1.3 Individu (unité statistique)
Une population est composée d’individus. Les individus qui composent une population statistique sont appelés unités statistiques.
Définition 3
On appelle individu tout élément de la population Ω, il est noté ω (ω dans Ω).
Remarque 1
L’ensemble Ω peut être un ensemble de personnes, de choses ou d’animaux...
L’unité statistique est un objet pour lequel nous sommes intéressés à recueillir de l’in- formation.
Exemple 3
– Dans l’exemple indiqué ci-dessus, un individu est tout étudiant de la section. – Si on étudie la production annuelle d’une usine de boîtes de boisson en métal (canettes). La population est l’ensemble des boîtes produites durant l’année et une boîte constitue un individu.
1.1.4 Caractère (variable statistique)
La statistique « descriptive », comme son nom l’indique cherche à décrire une population donnée. Nous nous intéressons au caractéristique des unités qui peuvent prendre différentes valeurs.
Définition 4
On appelle caractère (ou variable statistique, dénotée V.S) toute application
X : Ω → C.
L’ensemble C est dit : ensemble des valeurs du caractère X (c’est ce qui est mesuré ou observé sur les individus)
Exemple 4
Taille, température, nationalité, couleur des yeux, catégorie socioprofessionnelle,...
Remarque 2
Soit Ω un ensemble. On appelle et on note Card(Ω), le nombre d’éléments de Ω. Card(Ω) := nombre d’éléments de Ω = N.
1.1.5 Modalités
Les modalités d’une variable statistique sont les différentes valeurs que peut prendre celle-ci.
Exemple 5
– Variable est " situation familiale "
Modalités sont " célibataire, marié, divorcé "
– Variable est" statut d’interrupteur " Modalités sont " 0 et 1 ".
– Variable est " catégories socio-professionnelles " Modalités sont " Employés, ouvriers, retraités,... "
Les modalités sont les différentes situations dans lesquelles les individus peuvent se trouver à l’égard du caractère considéré.
1.2 - Types des Caractères
Nous distinguons deux catégories de caractères : les caractères qualitatifs et les caractères quantitatifs.
1.2.1 Caractère qualitatif
Les caractères qualitatifs sont ceux dont les modalités ne peuvent pas être ordonnées, c’est-à-dire que si l’on considère deux caractères pris au hasard, on ne peut pas dire de l’un des caractères qu’il est inférieur ou égal à l’autre. Plus précisément, nous avons la définition suivante.
Définition 5
Les éléments de C sont représentés par autre chose que des chiffres.
Exemple 6
L’état d’une maison : on peut considérer les modalités suivantes – Ancienne.
– Dégradée.
– Nouvelle.
– Rénovée
1.2.2 Caractère quantitatif
Les caractères quantitatifs sont des caractères dont les modalités peuvent être ordon- nées. Ainsi, l’âge, la taille de vie ou le salaire d’un individu sont des caractères quantitatifs. Donc, nous avons la définition suivante.
Définition 6
L’ensemble des valeurs est représenté par des chiffres. De même, il est partagé en deux sortes de caractères, discret et continu (voir l’exemple).
Exemple 7
– Le salaire d’employés d’une usine. Modalités : 10000DA , 20000DA... Type : Discret.
– La rigidité des ressorts. Modalités : [10, 20] N/m Type : continu.
En général, la variable quantitative discrète est une variable ne prenant que des valeurs entières (plus rarement décimales). Le nombre de valeurs distinctes d’une telle variable est habituellement assez faible. Citons, par exemple, le nombre de maisons par quartier d’une ville. Une variable quantitative est dite continue lorsque les observations qui lui sont associées ne sont pas des valeurs précises, mais des intervalles. C’est le cas lorsque nous avons un grand nombre d’observations distinctes.
La statistique descriptive a pour objectif de synthétiser l’information contenue dans les jeux de données au moyen de tableaux, figures ou résumés numériques. Les variables statistiques sont analysées différemment selon leur nature (quantitative, qualitative).
0 Commentaires