Comment communiquer les résultats d’analyses statistiques?
– Il importe que les analyses répondent aux hypothèses de recherche. La structure de chaque analyse sera donc généralement la suivante:
1. Nature de l’hypothèse: Vous mentionnez l’hypothèse que vous souhaitez tester.
2. En second lieu, vous mentionnez la méthode statistique que vous avez employée pour tester cette hypothèse.
Exemple regroupant “1” et “2”:”Afin d’examiner si, conformément à l’hypothèse 3, les femmes ont des compétences supérieures aux hommes dans le domaine de la reconnaissance des émotions, nous avons soumis le score obtenu au test de reconnaissance émotionnelle à un test t pour échantillons indépendants.”
3. En troisième lieu, le résultat observé et la statistique pertinente. Généralement, vous mentionnez à cet endroit la statistique inférentielle (“t” ou “F” par exemple) qui sert à tester l’hypothèse ainsi que les statistiques descriptives (les moyennes sur lesquels portent vos tests par exemple). Il est souvent préférable, si les analyses sont complexes de décrire les résultats, grâce à des statistiques descriptives (montrez ce qu’on observe, quelle est leur configuration) avant de mentionner le résultat du test proprement dit.
4. Et enfin, la conclusion que cette analyse permet de tirer par rapport à cette hypothèse (est-elle confirmée ou non?).
Exemple regroupant “3” et “4”: “En accord avec l’hypothèse x, nous constatons que les femmes obtiennent des scores supérieurs aux hommes (Ms = 56.65 et 45.27 pour les femmes et les hommes respectivement). Cet effet est significatif, t(28) = 2.50, p <.05″.
Dans l’organisation de vos analyses, vous veillerez dans la mesure du possible à commencer par présenter les analyses les plus importantes.
Comment communiquer les résultats d’analyses complexes impliquant une mutlitude d’effets?
– De façon générale, je recommande de toujours commencer par effectuer les analyses les plus générales avant d’effectuer des analyses plus spécifiques. Imaginons que votre plan expérimental soit le suivant: sexe(homme, femme) x identification à la Belgique (élevée, basse) x Condition expérimentale (1,2). Vous commencerez sans doute par effectuer une analyse de variance factorielle, si votre VD est continue. Imaginons que vous obteniez une interaction entre les trois facteurs. Communiquez d’abord cette analyse et ensuite, examiner ce qui se passe au niveau inférieur: par exemple, en faisant deux anovas identification x condition chez les hommes et les femmes respectivement. Si à nouveau, vous observez des interactions entre deux facteurs, vous pourriez examiner l’effet de la condition chez les peu et les fort identifiés respectivmeent grâce à des tests t. En d’autres termes, vous passez de l’analyse la plus globale pour ensuite identifier ce qui se passe aux niveaux plus “locaux'”. Remarquons que cette démarche n’a généralement de sens que si une interaction est significative. Par exemple, dans le cas du plan 2 x 2 x 2 ci-dessus, si votre interaction entre les trois facteurs n’est pas significative, il n’est pas nécessaire de décomposer en deux anovas 2 x 2. En revanche, s’il y a une interaction entre deux des trois facteurs (par exemple, la condition et l’idenitification), on examinera l’effet d’un facteur (par exemple la condition) à chaque modalité du second (par exemple l’identification) en ignorant le troisième (ici le sexe).
Si vous faites une analyse impliquant différents “effets” (par exemple une ANOVA factorielle), mentionnez en premier lieu les effets qui sont pertinents par rapport à vos hypothèse. Par exemple, si votre hypothèse postule une interaction entre deux facteurs, commencez par mentionner cette interaction, même si elle n’est pas significative. Mentionnez les autres effets significatifs ensuite. Il n’est pas nécessaire d’évoquer des effets non significatifs (par exemple un effet principal) s’ils ne sont pas pertinents par rapport à vos hypothèses.
Quelles sont les conventions de notation d’une analyse statistique?
– Considérons l’analyse de variance comme exemple. Mais cette discussion est valable quelle que soit les méthode utilisée. Lorsqu’il effectue un test statistique, SPSS nous donne généralement trois informations qui seront notées:
– Les degrés de liberté (d.f.).
– Une statistique. Dans le cas qui nous occupe, le F (mais dans d’autres cas, cela pourrait-être le “t” ou le Chi carré): C’est une statistique qui a une certaine distribution théorique. En fonction de cette valeur, on peut déterminer si l’effet qui nous intéresse est significatif ou non.
– Le niveau de signification ou “p”.: S’il est inférieur à .05, l’effet est significatif.
On note toujours le F en italiques, suivis des degrés de liberté correspondant à l’effet et des degrés de libertés de l’erreur (ligne “error” dans SPSS). Les degrés se libertés sont entre parenthèses mais en caractères normaux (pas en italiques). Ensuite “=”, valeur de la statistique (Correspondant à la ligne F Dans le tableau transmis par SPSS; deux décimales) et enfin le niveau de signification (“p” en italiques, “<“, seuil: .05, .01 voire .1). Ci-dessous, voici un exemple d’output d’analyse de variance à deux facteurs effectué par SPSS. Les deux facteurs sont “sexe” et “condnum” et la variable dépendante “attitude”. On pourrait décrire les résultats de la façon suivante: Nous avons observé un effet principal du sexe, F(1,116) = 5.04, p < .05 ainsi qu’une interaction entre le sexe et la condition (condnum), F(2, 116) = 4.68, p < .05. En revanche, nous n’avons pas observé d’effet principal de la condition, F(2,116) = .16, p = .85.
– Dois-je mentionner mes statistiques dans le texte, dans des tableaux ou dans les annexes?
Lorsque vos analyses impliquent peu de groupes, vous pouvez mentionner les moyennes ou statistiques descriptives importantes dans le texte. Vous utiliserez uniquement des tableaux si vous avez de nombreuses statistiques à communiquer. Dans ce cas, veillez toujours à indiquer dans le texte à quel tableau il se réfère et à numéroter vos tableaux. Vos tableaux doivent du reste toujours être “expliqués” dans le texte. Si certaines informations analyses ne sont pas absolument nécessaires à la compréhension de votre texte et à la validation de vos hypothèses, mais qu’elles vous semblent toutefois susceptibles d’intéresser le lecteur, incluez les dans les annexes. Référez le lecteur à ces annexes dans le texte (cf. annexe x).
Utilisez les figures uniquement pour les résultats particulièrement importants par rapport à vos hypothèses. N’abusez jamais des figures. Ne les utilisez que si elles aident à comprendre les résultats. Par exemple, pour comparer les moyennes de deux groupes, on n’a pas besoin d’une figure. Par contre, pour visualiser une interaction entre deux facteurs, cela s’avère particulièrement utile. Par ailleurs, une figure doit être immédiatement compréhensible: si ce n’est pas le cas, prévoyez une petite note sous cette figure afin de la rendre plus explicite.
Cela dépend naturellement de votre étude mais en général les conseils suivants sont applicables:
1-Commencer par décrire votre échantillon (composition démographique, âge, caractéristiques pertinentes par rapport à la théorie – par exemple pour une étude sur la perception de l’obésité, l’indice de masse corporel moyen peut être une information intéressante). Expliquez également le cas échéant pourquoi vous avez retiré certains sujets des analyses ultérieures.
2-Ensuite, s’il s’agit d’une expérience, faites part des mesures de “manipulation check” (vérification de la manipulation). La manipulation a-t-elle fonctionné?
3-Ensuite, suivez non pas l’ordre du questionnaire mais l’ordre logique des hypothèses en examinant, une à une si chacune d’entre elles a été vérifiée.
– Généralement, il n’est donc pas pertinent de suivre l’ordre du questionnaire dans la présentation des résultats. Il est beaucoup plus important de suivre un ordre logique par rapport aux hypothèses en commençant par mentionner les résultats pertinents par rapport aux hypothèses et en explorant ensuite des mesures annexes ou qui permettent de mieux appréhender les processus responsables des résultats observés. Par exemple, si vous vous demandez si les femmes obtiennent des scores inférieurs aux hommes à un test de mathématiques parce qu’elles sont plus anxieuses, il serait pertinent de menionner en premier lieu les résultats relatifs à l’effet du sexe sur la performance en mathématiques et ensuite seulement, les résultats relatifs aux différences d’anxieté entre hommes et femmes.
Combien de décimales utiliser?
Généralement, ne mentionnez pas plus que deux décimales. Bien sûr, on pourra faire quelques exceptions pour les nombres très petits (comme les seuils de significations).
– Résumez les principaux résultats et leur rapport avec les hypothèses à la fin de la section “résultats”.
– Ne recopiez jamais intégralement des listings SPSS!!! Dans la plupart des cas, les analyses communiquées par SPSS regorgent d’une quantité d’informations superflues ou inutiles dans le cadre d’un rapport de recherche. Il suffit généralement de communiquer les statistiques descriptives sur lesquelles portent l’hypothèses (généralement des moyennes, parfois des corrélations, ou des coefficients de régressions) et la statistique pertinente (t, f).
– N’interprétez pas vos résultats dans la partie “résultats”. Contentez vous de les décrire. Les raisons pour lesquelles des résultats particuliers sont observés (ou non) sont l’objet de la partie discussion.
– Lorsque vous mentionnez vos variables dans le texte, ou qu’elles sont écrites dans vos tableaux ou figures, utilisez des termes français transparents et non pas des codes. Par exemple, si la variable “implication” a été codée “implic” dans SPSS, vous veillerez à ce que le terme “implication” soit toujours employé pour la décrire dans votre section résultats.
– Veillez à utiliser des termes précis pour décrire vos effets. Ces termes doivent être appropriés à vos analyses. Par exemple, un test t porte sur des moyennes et non pas sur des corrélations. Un test chi carré examine si deux variables sont indépendantes ou non, etc. Quand vous utilisez des termes tels que “corrélation”, “interaction”, “indépendance” dans une partie “résultats”, vous devez vous assurez qu’ils sont appropriés d’un point de vue statistique. Même si “en français”, ils vous semblent bien s’appliquer à vos résultats, ils ne sont pas nécessairement adéquats d’un point de vue statistique.
– N’abusez pas des figures et réservez leur usage aux résultats importants. Voir ci-dessus.
– Comme la description de vos résultats doit être organisée en fonction des hypothèses et se centrer principalement sur les résultats pertinents par rapport à celles-ci, vous ne devriez pas inonder votre lecteur de résultats. Seuls les résultats importants doivent être mentionnés. Soyez donc économe. Par exemple, on a rarement besoin de connaître l’écart-type, l’effectif, le minimum et le maximum (par ex.) pur chaque analyse présentée. Voir aussi l’usage des annexes et des tableaux
– Souvent, on peut lire dans les mémoires, les résultats d’analyses items par item d’un questionnaire. Souvent toutefois, il est possible de regrouper des items qui mesurent une dimension commune et ce grâce à une analyse factorielle ou à l’alpha de cronbach. Envisagez toujours cette possibilité.
– Généralement, il n’y a pas de nécessité d’expliquer en détail ce que veut dire un résultat significatif, d’un point de vue statistique, ou d’expliquer en détail à quoi servent des méthodes statistiques communes. Dans la plupart des cas, vos lecteurs sont supposés familiers avec ces notions.
– N’utilisez pas de termes qui impliquent la causalité si votre méthodologie ne permet pas d’inférer une telle relation de causalité.
Selon l’hypothèse X, une analyse du nombre d’heure de télévision et de fréquence d’actes agressifs chez chacun des 60 enfants devrait révéler une relation positive entre l’exposition à la télévision et la probabilité de comportements agressifs. L’utilisation du coefficient de corrélation de Pearson confirme cette observation, r(58) = .63, p < .001.
Selon l’hypothèse X, la prise de médicaments hypnotiques devrait affecter la mémoire à court terme. Effectivement, le group contrôle (M = 14.1) a retenu davantage de mots que le groupe ayant consommé de tels médicaments (M = 12.3).Cette différence a été testée grâce à un test t pour échantillons indépendants, qui n’a toutefois pas révélé de différences significative entre les conditions, t(18) = 1.23, p = .283.
Selon l’hypothèse X, les hommes sont plus confiants en leur aptitudes d’orientation que les femmes. Effectivement, alors que 60% des hommes admettaient qu’ils étaient de bons lecteurs de cartes routières, seules 35% des femmes l’affirmaient. Un Khi carré a révélé une différence significative, X2 (1, N = 119) = 10.51, p = .0012, indiquant qu’il existait bien une relation entre le genre et la confiance en aptitude d’orientation.
4. Une analyse de variance à un facteur suivie de comparaisons post hoc
Remarque. L’étude est la suivante: les sujets ont dû lire une histoire pouvant se terminer de trois façons (le héros se comporte de façon courageuse, lâche, fin non spécifiée). Cette “fin” définit la variable “condition”. La variable dépendante est la réponse à l’item suivant: “si vous n’aviez pas connaissance de la fin, dans quelle mesure auriez vous trouvé probable que le héros se comporte de la façon suivante” (suivait une description de la fin courageuse). Les sujets doivent donc imaginer ce qu’ils auraient prédit s’ils n’avaient pas eu connaissance de la fin.
Nous avons émis l’hypothèse selon laquelle les sujets de la condition courageuse percevraient la fin courageuse comme plus probable que dans les deux autres conditions. Nous avons donc effectué une analyse de variance à un facteur afin de déterminer s’il existe des différences entre les estimations probabilités moyennes d’une fin courageuse en fonction de la fin réelle. Nous observons un effet de ce facteur, F(2,65) = 27.42, p < .001. Grâce à un test de comparaison multiples (Student-Newman-Keuls), nous constatons que cet effet est dû au fait que les sujets de la condition « fin courageuse » estiment une fin « courageuse » comme davantage probable que les sujets ayant été confrontés aux deux autres fins (Ms = 6.25, 4.32 et 4.0 respectivement, p < .05).déterminer s’il existe des différences entre les estimations probabilités moyennes d’une fin courageuse en fonction de la fin réelle. Nous observons un effet de ce facteur, F(2,65) = 27.42, p < .001. Grâce à un test de comparaison multiples (Student-Newman-Keuls), nous constatons que cet effet est dû au fait que les sujets de la condition « fin courageuse » estiment une fin « courageuse » comme davantage probable que les sujets ayant été confrontés aux deux autres fins (Ms = 6.25, 4.32 et 4.0 respectivement, p < .05).