Devoir de Philosophie

Les statistiques (Sciences & Techniques)

Publié le 22/02/2012

Extrait du document

Les statistiques ont ceci de particulier qu'elles manient des instruments abstraits - chiffres, formules - pour tenter d'interpréter des phénomènes qui ont, le plus souvent, trait au domaine du vivant. Les statistiques constituent une branche des mathématiques qui s'intéresse à la collecte, au traitement et à l'analyse des données. Le terme "statistiques" désigne aussi les observations réalisées sur un groupe d'individus ou d'entités dans des conditions précises. Par exemple, on peut dénombrer les accidents de la route par an dans le monde. Les statistiques sont réalisées en France par des ministères ou des organismes publics, tel l'INSEE (Institut national de la statistique et des études économiques). Certaines sociétés privées effectuent également des études de ce type, par exemple les sondages d'opinion.

« d'être exacts. La présentation des données Considérons les notes obtenues à un examen de mathématiques par un groupe déterminé de 24 élèves.

Il s'agit ici d'étudier larépartition des notes dans le groupe d'élèves.

On peut tout d'abord classer les notes de la plus petite à la plus grande : 44, 44,45, 58, 58, 58, 62, 62, 67, 72, 72, 81, 81, 81, 81, 84, 84, 88, 95, 95, 95, 95, 100, 100.

Ainsi, on sait immédiatement que lesnotes s'échelonnent de 44 à 100.

On appelle effectif d'une note le nombre d'élèves ayant obtenu cette note.

La fréquence d'unenote est le rapport de son effectif sur l'effectif total (ici 24) ; la fréquence cumulée d'une note est la somme de sa fréquence et desfréquences des notes inférieures.

Ici, la variable considérée (note) est discontinue, c'est-à-dire qu'elle ne prend que des valeursdiscrètes (isolées et bien déterminées).

Les données recueillies et les fréquences qui en découlent sont présentées sous forme detableau, de façon à pouvoir les interpréter facilement.

On peut représenter la répartition des notes par un diagramme en bâtons : àchaque valeur de la variable (note, notée xi ) est associé un bâton vertical dont la longueur est proportionnelle au nombre de cas observés (nombre d'élèves) ou à la fréquence, notée fi .

Ainsi, on trace le graphique (voir figure 1) qui donne fi en fonction de xi . Un graphique des fréquences cumulées (voir figure 2) représente les notes sur l'axe des abscisses ; sur l'axe des ordonnées sontindiquées les fréquences cumulées en pourcentage. Lorsque le nombre de données est trop important, on divise les données en groupes adaptés, généralement d'étendue égale,appelés classes.

Les classes ne doivent pas être trop nombreuses et bien rendre compte de la répartition des données.

Parexemple, si l'on considère les notes obtenues à l'examen de mathématiques par 20 groupes de 24 élèves chacun (soit 480élèves), on peut introduire les classes suivantes : Pour une classe, l'effectif cumulé est le nombre d'élèves ayant eu une note égale ou inférieure au maximum de la classe.

Parexemple, 42 élèves ont eu une note inférieure ou égale à 20 (deuxième ligne du tableau).

On peut présenter les données sousforme d'histogramme (voir figure 3).

Il s'agit d'une figure constituée de rectangles dont la largeur est l'amplitude de la classecorrespondante et dont la hauteur est proportionnelle à l'effectif de la classe. On peut également tracer un histogramme des fréquences cumulées.

Pour chaque classe, la hauteur du rectangle est alorsproportionnelle à l'effectif cumulé correspondant. Mesure de la tendance centrale Le statisticien travaille souvent avec un très grand nombre de données.

L'une de ses tâches est alors de les réduire, c'est-à-direde les remplacer par des paramètres, ou caractéristiques, qui sont de deux types : ceux qui donnent une idée globale de latendance centrale des valeurs ; ceux qui indiquent la dispersion (étalement) des valeurs observées. Pour évaluer la tendance centrale, on peut calculer un nombre qui résume en quelque sorte l'ensemble des données : la moyennearithmétique.

Considérons la série de données x1, x2,...

, xi,...

, xm, d'effectifs respectifs n1, n2,...

, ni..., nm. La moyenne arithmétique x de ces valeurs (prononcer "x barre") est alors : Ainsi, dans l'exemple du groupe des 24 élèves, la note moyenne obtenue par le groupe est : Dans le cas général, la moyenne arithmétique est aussi égale à : La médiane et le mode sont deux autres mesures de la valeur centrale.

La médiane est la valeur telle qu'il existe un nombre égald'observations, ou de valeurs, inférieures et supérieures à cette valeur.

Ainsi, si l'on classe les m résultats observés dans l'ordrecroissant, si m est impair, la médiane est la valeur de la variable correspondant au rang (m + 1)/2.

Par exemple, considérons les 5résultats suivants : 2, 4, 8, 41, 45 ; la médiane est la troisième valeur, à savoir 8, alors que la moyenne vaut 20.

Quand le nombrede résultats est pair, la médiane n'est pas vraiment définie : elle est indéterminée entre les deux valeurs centrales.

Ainsi,considérons les données : 2, 4, 7, 8, 41, 45 ; la médiane est située entre 7 et 8.

Le mode, également appelé dominante, est lavaleur de la variable dont la fréquence est maximale.

Un ensemble de données peut avoir plusieurs modes.

Dans l'exempleprécédent des notes obtenues par les 24 élèves, les modes sont 81 et 95. Mesure de la dispersion. »

↓↓↓ APERÇU DU DOCUMENT ↓↓↓

Liens utiles