Le test Khi-deux d’indépendance
A quoi ça sert?
Ce test est intéressant lorsque nous nous intéressons aux relations entre deux variables nominales ou qualitatives (pour plus de deux variables, il est nécessaire de recourir à une méthode plus complexe, l’analyse loglinéaire). Par exemple, est-ce que l’appartenance politique dépend du sexe? Est-ce que les jeunes filles anorexiques ont plus de chances d’être enfants uniques que les autres? Est-ce que les immigrés nord-africains de seconde génération sont plus susceptibles de consommer régulièrement de l’alcool (oui/non) que les immigrés de première génération?
Un exemple
Ce test indique donc si les fréquences d’observation d’une catégorie dépendent des modalités (c’est-à-dire les “valeurs que peut prendre”) l’autre catégorie. Par exemple, dans un mémoire récent, Rebecca Lévêque s’intéressait aux profils des jeunes filles fréquentant des filières scolaires professionnelles à dominante “masculine” (par ex. “mécanicien”) vs. à dominante féminine (par ex. “esthéticienne”). Elle a mesuré grâce à un questionnaire développé par Sandra Bem leur profil sur un nombre de traits de personnalité, ce qui l’a amené à les catégoriser (en suivant le modèle de Bem) en quatre groupes: profil “féminin”, profil “masculin”, profil “androgyne” (traits féminins & masculins), profil “indifférencié” (aucun des deux).
source: flickr
Elle s’est naturellement demandé si les fréquences d’apparition des différents profils dépendaient de la filière. Par exemple, y a-t-il plus de filles “masculines” et moins de filles “féminines” dans les filières masculines? Pour le savoir, elle a d’abord construit un “tableau de contingence” qui consiste à compter le nombre d’observations apparaissant dans chaque combinaison filière/profil (on l’obtient directement à travers la commande analyse/statistiques descriptives/tableaux de contingence/en faisant glisser les deux variables l’une en ligne, l’autre en colonne et en cliquant sur OK). Chacune des cases de ce tableau est appelée “cellule”. Dans chaque cellule, on trouve les fréquences “observées”:
Filière féminine | Filière masculine | Total | |
indifférencié | 7 | 7 | 14 |
féminine | 12 | 3 | 15 |
masculine | 7 | 12 | 19 |
androgyne | 16 | 3 | 19 |
Total | 42 | 25 | 67 |
Chaque prise de donnée (ici l’appartenance d’une jeune fille) correspond à une “observation” (il y en a donc 67 en tout).
A l’examen du tableau ci-dessus, il semblerait que le profil dépend effectivement de la filière: a vue d’oeil, il semble y avoir davantage de jeunes filles féminines ou androgynes dans les filières féminines par ex. Mais peut-être cette différence est-elle due au hasard? En d’autres termes, peut-être que si nous avions pu avoir accès à toutes les jeunes filles qui suivent des filières professionnelles, il n’y aurait pas eu de différence de profil.
Si les fréquences d’observation des différents profils sont identiques selon que l’on soit dans une filière masculine ou féminine, on parle d’indépendance. C’est l’hypothèse nulle du test.
Dans SPSS, si on demande les effectifs attendus (analyse/statistiques descriptives/tableaux croiseaux/cellules/cliquer sur “attendu”), le logiciel nous fournira les valeurs qui correspondent à cette hypothèse. On obtiendrait ceci:
Flière féminine | Filière masculine | Total | |
indifférencié | 8,78 | 5,22 | 14,00 |
féminine | 9,40 | 5,60 | 15,00 |
masculine | 11,91 | 7,09 | 19,00 |
androgyne | 11,91 | 7,09 | 19,00 |
Total | 42,00 | 25,00 | 67,00 |
Donc, si la filière et le profil psychologique étaient indépendants, nous devrions nous attendre à observer 8,78 jeunes fille de profil indifférencié dans les filières féminines, 9,40 de profil féminin, etc (ce nombre est calculé en multipliant l’effectif de la colonne et de la ligne pour chaque cellule et en divisant ce nombre par l’effectif total: par ex., 8.78 = 42*14/67). Mais naturellement, les données se conforment très rarement à cet idéal (ne fut-ce qu’en raison des décimales) et ce même si le modèle d’indépendance était approprié. Dans le cas qui nous occupe, nous constatons que nous observons 16 filles androgynes dans les filières “féminines” alors qu’en cas d’indépendance, nous devrions en obtenir 11.91. On obtient donc une différence de 4.09. Ces différences s’accumulent bien sûr si on examine chaque cellule. Est-ce qu’une déviation aussi importante par rapport aux fréquences observées que celle que nous observons pourrait être le fait du hasard?
La statistique “Khi-deux” (chi square en anglais) mesure le degré auquel les données s’éloignent de cette situation d’indépendance et, grâce à des informations sur sa distribution, on peut estimer si cette déviation est susceptible d’être expliquée par le hasard.
Si la probabilité qu’il en soit ainsi est inférieure au seuil de .05, on en conclura qu’il y a peu de chances que les variables soient indépendantes dans la population et, donc, qu’effectivement, il y a une dépendance entre les deux variables: le profil de Bem dépend de la formation ou n’est pas représenté de la même façon selon la formation. C’est bien le cas ici car notre X2 (3) = 12.07,p < .01 (Remarque: dans un mémoire ou un document scientifique, Khi-deux doit s’écrire avec la lettre grecque accessible dans word via inséer/caractère spéciaux dans la liste de polices “symboles” – le Khi ressemble à un X). Entre parenthèses, à côté de la valeur du X2, on trouve les “degrés de libertés” qui sont calculés en calculant le produit suivant: (nombre de colonnes -1) * (nombres de lignes-1).
Tests du Khi-deux | |||
Valeur | ddl | Signification asymptotique (bilatérale) | |
Khi-deux de Pearson | 12,074a | 3 | 0,007 |
Rapport de vraisemblance | 12,518 | 3 | 0,006 |
Association linéaire par linéaire | 1,317 | 1 | 0,251 |
Nombre d’observations valides | 67 | ||
a. 0 cellules (,0%) ont un effectif théorique inférieur à 5. L’effectif théorique minimum est de 5,22. | |||
On obtient cette statistiques en choisissant l’option “statistiques/et en cochant “Khi-deux”” dans le menu “tableaux croisés”. Pour avoir une idée plus précise des sources de ces différences, il peut être utile de demander à SPSS de calculer le pourcentage de femmes dans chaque catégorie selon la filière (dans “analyses/statistiques descriptives/tableaux croisés, cliquer sur “cellules” & demande “position”). Je l’ai fait et j’obtiens ceci:
Flière féminine | Filière masculine | |
indifférencié | 17 | 28 |
féminine | 29 | 12 |
masculine | 17 | 48 |
androgyne | 38 | 12 |
Total | 100 | 100 |
Comment calcule-t-on le Khi-deux?
La statistique Khi-deux est d’autant plus élevée que les écarts entre fréquences observées et attendues sont importants.
Remarquons que techniquement on la calcule en
1- calculant pour chaque cellule la différence entre la fréquences observées et la fréquence attendue
2- En divisant cet écart par la fréquence attendue
3- En calculant le carré de la valeur ainsi obtenue (de façon à ce que les “négatifs” n’annulent pas les “positifs”).
4- En faisant la sa somme de ces valeurs pour chaque cellule.
Ca donne ceci en langage mathématique (O correspond à la valeur attendue et E à la valeur observée):
Comment faire dans SPSS (PASW)?
Les commandes relatives aux tableaux de contingence sont situées dans le menu “analyses/statistiques descriptives/tableaux croisés”.
Il faut d’abord faire glisser les deux variables impliquées: l’une dans “colonne”, l”autre dans “lignes”. Remarquons que si on souhaite examiner les relations entre deux variables en fonction d’une troisième (par exemple, est-ce que la relation entre profil de genre et filière dépend d’une troisième variable nominale comme, par exemple, le type d’emploi du père (ouvrier, employé, cadre))? Dans ce cas, on fera glisser la troisième variable dans “strate”.
Pour obtenir la statistique Khi Carré, on clique sur “Statistiques” et on coche Khi Deux.
Pour obtenir les fréquences attendues selon un modèle d’indépendance, on peut cocher “attendu”. Les fréquences observées sont fournies par défaut.
Conditions d’application: pour appliquer le test, il est nécessaire que chaque observation soit indépendante des autres (par exemples, elles ne peuvent pas avoir été récoltées chez un même sujet) et que le nombre de cellules (“cases”) ayant des fréquences attendues inférieures à 5 soit inférieure à 1/3 du nombre de cellules totales. Remarquons que cette dernière condition est considérée par certains auteurs comme trop exigeante.