Vincent GODARD

Département de Géographie

Université de Paris 8


V.1.3 - Dernière mise à jour : 03/01/2005

 

Fiche Mémo n°3.2. du cours de Statistique :

La moyenne arithmétique

 

 

C'est la valeur centrale la plus utilisée

mais elle n'est calculable que sur des caractères quantitatifs

 

1. Calcul sur des données brutes

La moyenne arithmétique* est conventionellement notée et vaut :

formule n°1 (mem32sta.htm)

i est le numéro d'une modalité [i = {1; 2 ; ... ; j - 1 ; j}];

j est le nombre de modalités ( j peut être égal à N si la variable n'est pas en classes) ;

N est l'effectif total.

c'est la somme des valeurs observées divisée par le nombre d'observations

 

2. Calcul sur des données groupées

- Dans le cas d'une distribution groupée ou de fréquences,

on calcule alors une moyenne arithmétique pondérée :

formule n°2 (mem32sta.htm)

ou :

formule n°3 (mem32sta.htm)

avec :

xi remplacée par le centre de classe de la modalité i ;

ni l'effectif de la modalité i ;

fi la fréquence de la modalité i.

- Dans le cas d'une distribution non groupée,

toutes ces formules sont équivalentes

- Par contre, pour les distributions groupées,

on commet une légère erreur en remplaçant chacune des valeurs modalités par son centre de classe (CC)

En théorie, le centre de classes s'obtient en sommant la borne supérieure et la borne inférieure de la modalité. Somme que l'on divise par 2 (cf. DAGNELIE 1984, vol.1, p.24)

Exemple :

- Calculer la superficie moyenne des fermes du canton de X

- Le mode, la médiane et la moyenne sont-ils dans la même classe ?

- Qu'en concluez- vous ? Quelle est la forme de la distribution ?

Superficie en ha

Nb de fermes

Centre de classes

Produit

xi

ni

CC

CC * ni

[0 ; 10[

4

5

20

[10 ; 20[

10

15

150

[20 ; 30[

14

25

350

[30 ; 40[

12

35

420

[40 ; 50[

10

45

450

Somme

50

1 390

- La superficie moyenne est de 1 390 / 50 = 27,8 ha

- La médiane est de 28,2 ha

- La classe modale contient la moyenne, la courbe est relativement symétrique autour de 25 ha

 

Remarque :

- La moyenne arithmétique est le centre de gravité de la distribution

C'est-à-dire :

formule n°4 (mem32sta.htm)

Si la distribution est groupée :

formule n°5 (mem32sta.htm)

Autrement dit,

la somme des écarts à la moyenne est nulle

- Les valeurs extrèmes décentrent la moyenne.

mais, elles peuvent n'être que :

- peu significatives

- très exceptionnelles

voire,

- aberrantes

Il faut donc contrôler leur pertinance

- Il faut toujours préciser la sous-population étudiée

surtout si on élimine quelques valeurs extrèmes

- Enfin, la moyenne n'est le centre de la distribution que si celle-ci est normale ou proche de la normale

C'est-à-dire :

lorsque la distribution à la forme d'une courbe en cloche

Sinon ce n'est qu'une valeur de position sur une échelle

 

3. Analyse d'un exemple

Tableau 1 (mem32sta.htm) - PIB par habitant des régions de France, d'Italie et d'Espagne en 1991 - (Sources : Eurostat, 1992, in SAINT-JULIEN 1999, p.23).

Téléchargement du tableau

Ce fichier est au format EXCEL 5.0 et "pèse" 97 Ko.

 

3.1. Pour l'ensemble des régions des trois pays

Sur le tableau 1b

- Calculer la moyenne arithmétique, la médiane et le mode du caractère "PIB par habitant en 1991"

- Que vous apprend la presque supperposition des trois valeurs centrales ?

Après avoir trié le caractère "PIB par habitant en 1991" par ordre croissant

- Réaliser le diagramme en bâtons de la distribution de ce caractère

- avec un pas de 1 000 ECU

- avec un pas de 2 500 ECU

- Les deux distributions sont-elles foncièrement différentes ?

- Quelle valeur centrale vous paraît le mieux résumer la distribution ?

 

3.2. Comparaison des régions des trois pays

Sur le tableau 1c

3.2.1. Représentation graphique

Après avoir trié le caractère "PIB par habitant en 1991" par région et par ordre croissant

- Réaliser les courbes (fonction nuage de points d'EXCEL) de la distribution de ce caractère

- avec un pas de 2 500 ECU

Que peut-on dire de la disparité des richesses :

- entre les pays ?

- à l'intérieur de chaque pays ?

3.2.2. Écart à la moyenne des trois pays

- Calculer la moyenne arithmétique

- globale

- pour chaque pays

- Calculer la position relative de chaque région par rapport à la moyenne arithmétique :

- globale (colonne écart à la moyenne des trois pays)

- de chaque pays (colonne écart à la moyenne du pays d'appartenance)

- Quelle est la signification de ces écarts ?

- Que vaut la moyenne de ces écarts à la moyenne ?

- Calculer le nombre de régions au dessus de la moyenne, à l'aide de la fonction EXCEL

=NB.SI(E6:E63;">0")

- Est-il identique pour les deux calculs de moyenne ?

- Montrer, à l'aide quelques exemples, comment le choix de la population de référence modifie la perception que l'on peut avoir de la position relative des régions

 

Note :

La moyenne arithmétique n'est pas toujours la mieux adaptée.

C'est le cas pour les phénomènes :

- multiplicatifs ;

- cumulatifs ;

- ou mettant en cause des fractions.

 

4. Test de compréhension

Communiquez-moi par courrier électronique les réponses aux questions suivantes

Question n°3.2.1. Quel est le pays pour lequel la moyenne arithmétique est la moins représentative (cf. Tab1c) ?

a) Espagne

b) France

c) Italie

Question n°3.2.2. Quel est le pays qui a une distribution bimodale, à deux modes, (cf. Tab1c) ?

a) Espagne

b) France

c) Italie

 

Précisez à la rubrique objet :

EC statistique

puis dans le corps du message vos

n° d'étudiant, nom et prénom

puis vos

réponses

vgodard@univ-paris8.fr

 

 

Retour au début de la fiche Mémo

 

Fiche Mémo suivante

 

NB : les mots suivis de "*" font partie du vocabulaire statistique, donc leur définition doit être connue. Faites-vous un glossaire.