V.1.3 - Dernière mise à jour : 03/01/2005
C'est la valeur centrale la plus utilisée
mais elle n'est calculable que sur des caractères quantitatifs
La moyenne arithmétique* est conventionellement notée et vaut :
formule n°1 (mem32sta.htm)
i est le numéro d'une modalité [i = {1; 2 ; ... ; j - 1 ; j}];
j est le nombre de modalités ( j peut être égal à N si la variable n'est pas en classes) ;
N est l'effectif total.
c'est la somme des valeurs observées divisée par le nombre d'observations
- Dans le cas d'une distribution groupée ou de fréquences,
on calcule alors une moyenne arithmétique pondérée :
formule n°2 (mem32sta.htm)
ou :
formule n°3 (mem32sta.htm)
avec :
xi remplacée par le centre de classe de la modalité i ;
ni l'effectif de la modalité i ;
fi la fréquence de la modalité i.
- Dans le cas d'une distribution non groupée,
toutes ces formules sont équivalentes
- Par contre, pour les distributions groupées,
on commet une légère erreur en remplaçant chacune des valeurs modalités par son centre de classe (CC)
En théorie, le centre de classes s'obtient en sommant la borne supérieure et la borne inférieure de la modalité. Somme que l'on divise par 2 (cf. DAGNELIE 1984, vol.1, p.24)
Exemple :
- Calculer la superficie moyenne des fermes du canton de X
- Le mode, la médiane et la moyenne sont-ils dans la même classe ?
- Qu'en concluez- vous ? Quelle est la forme de la distribution ?
Superficie en ha Nb de fermes Centre de classes Produit xi ni CC CC * ni [0 ; 10[ 4
5
20
[10 ; 20[ 10
15
150
[20 ; 30[ 14
25
350
[30 ; 40[ 12
35
420
[40 ; 50[ 10
45
450
Somme 50
1 390
- La superficie moyenne est de 1 390 / 50 = 27,8 ha
- La médiane est de 28,2 ha
- La classe modale contient la moyenne, la courbe est relativement symétrique autour de 25 ha
Remarque :
- La moyenne arithmétique est le centre de gravité de la distribution
C'est-à-dire :
formule n°4 (mem32sta.htm)
Si la distribution est groupée :
formule n°5 (mem32sta.htm)
Autrement dit,
la somme des écarts à la moyenne est nulle
- Les valeurs extrèmes décentrent la moyenne.
mais, elles peuvent n'être que :
- peu significatives
- très exceptionnelles
voire,
- aberrantes
Il faut donc contrôler leur pertinance
- Il faut toujours préciser la sous-population étudiée
surtout si on élimine quelques valeurs extrèmes
- Enfin, la moyenne n'est le centre de la distribution que si celle-ci est normale ou proche de la normale
C'est-à-dire :
lorsque la distribution à la forme d'une courbe en cloche
Sinon ce n'est qu'une valeur de position sur une échelle
Tableau 1 (mem32sta.htm) - PIB par habitant des régions de France, d'Italie et d'Espagne en 1991 - (Sources : Eurostat, 1992, in SAINT-JULIEN 1999, p.23).
Ce fichier est au format EXCEL 5.0 et "pèse" 97 Ko.
Sur le tableau 1b
- Calculer la moyenne arithmétique, la médiane et le mode du caractère "PIB par habitant en 1991"
- Que vous apprend la presque supperposition des trois valeurs centrales ?
Après avoir trié le caractère "PIB par habitant en 1991" par ordre croissant
- Réaliser le diagramme en bâtons de la distribution de ce caractère
- avec un pas de 1 000 ECU
- avec un pas de 2 500 ECU
- Les deux distributions sont-elles foncièrement différentes ?
- Quelle valeur centrale vous paraît le mieux résumer la distribution ?
Sur le tableau 1c
Après avoir trié le caractère "PIB par habitant en 1991" par région et par ordre croissant
- Réaliser les courbes (fonction nuage de points d'EXCEL) de la distribution de ce caractère
- avec un pas de 2 500 ECU
Que peut-on dire de la disparité des richesses :
- entre les pays ?
- à l'intérieur de chaque pays ?
- Calculer la moyenne arithmétique
- globale
- pour chaque pays
- Calculer la position relative de chaque région par rapport à la moyenne arithmétique :
- globale (colonne écart à la moyenne des trois pays)
- de chaque pays (colonne écart à la moyenne du pays d'appartenance)
- Quelle est la signification de ces écarts ?
- Que vaut la moyenne de ces écarts à la moyenne ?
- Calculer le nombre de régions au dessus de la moyenne, à l'aide de la fonction EXCEL
=NB.SI(E6:E63;">0")
- Est-il identique pour les deux calculs de moyenne ?
- Montrer, à l'aide quelques exemples, comment le choix de la population de référence modifie la perception que l'on peut avoir de la position relative des régions
Note :
La moyenne arithmétique n'est pas toujours la mieux adaptée.
C'est le cas pour les phénomènes :
- multiplicatifs ;
- cumulatifs ;
- ou mettant en cause des fractions.
Communiquez-moi par courrier électronique les réponses aux questions suivantes Question n°3.2.1. Quel est le pays pour lequel la moyenne arithmétique est la moins représentative (cf. Tab1c) ?
Question n°3.2.2. Quel est le pays qui a une distribution bimodale, à deux modes, (cf. Tab1c) ?
|
NB : les mots suivis de "*" font partie du vocabulaire statistique, donc leur définition doit être connue. Faites-vous un glossaire.