ANOVAs à plusieurs facteurs
Petite intro pour une page importante
L'ANOVA (analyse de variance, ou ANalysis Of VAriance) à 2 ou 3 facteurs est l'outil qui sert à mettre les interactions en évidence. On parle d'interaction entre deux facteurs lorsque "l'effet d'un facteur n'a pas le même effet sur la variable dépendante selon les modalités de l'autre facteur" (phrase magique). Dans le cas de mesures répétées, c'est lorsque l'on observe une "différence d'évolution de la VD selon les modalités de l'autre facteur"; le premier facteur étant un facteur permettant l'utilisation de mesures répétées. Une interaction entre 3 facteurs signifie que "l'amplitude de l'interaction entre deux facteurs change selon les modalités du troisième facteur"... Seuls des exemples concrets permettent de bien comprendre. Enfin, à partir de 4 facteurs, soit l'analyse résulte d'un plan expérimental mal planifié au départ et devient pratiquement ininterprétable, soit elle est volontaire, son plan expérimental a été réfléchi globalement par un chercheur qui maîtrise parfaitement à la fois ce type d'analyse et son sujet de recherche et donc, ce blog lui est inutile !
Cette page aborde :
- généralités,
- les aspects contre-intuitifs de l'ANOVA à 2 (et plus de 2) facteurs,
- comment entrer les données dans un logiciel,
- comment interpréter ce qui sort du logiciel stat à partir d'exemples,
- les indications supplémentaires données par quelques logiciels,
- que faire après.
Généralités
Une ANOVA à 2 facteurs donnera trois types de résultats :
- l'effet global du premier facteur,
- l'effet global du second facteur,
- l'interaction entre les deux facteurs
(une ANOVA à 3 facteurs donnera sept types de résultats : les effets globaux des 3 facteurs, les interactions entre les facteurs 1 et 2, 2 et 3, 1 et 3, et l'interaction entre les facteurs 1, 2 et 3; une ANOVA à 4 facteurs donnera... 15 (QUINZE) types de résultats... mais vous aurez eu l'intelligence de ne pas dépasser 3 facteurs).
L'aspect contre-intuitif de l'ANOVA à plusieurs facteurs
Lorsque l'on a compris la notion d'interaction, le seul problème est de comprendre ce qu'est un "effet global". L'effet global est un effet moyen qui tient compte du nombre de sujets des échantillons mais pas de celui de la population.
Exemple
J'étudie l'effet d'un anti-amnésiant destiné à pallier un déficit lié à la maladie d'Alzheimer. Celui-ci a un effet chez les patients Alzheimer de 55-60 ans, mais pas chez des sujets non Alzheimer du même âge.
En Bleu : sujets sains; en rose : sujets Alzheimer
Intuitivement, on a envie de dire en voyant le graphique, que la substance a un effet promnésiant uniquement chez les sujets Alzheimer; que les sujets Alzheimer non traités ont des performances mnésiques inférieures aux autres, et c'est tout.
L'ANOVA dira qu'il y a interaction entre l'état du sujet (Alzheimer ou sain) et la prise de la substance (substance ou placebo); c'est ce qui traduit l'idée que "la substance a un effet promnésiant uniquement chez les sujets Alzheimer". Mais elle dira peut-être aussi que la substance a un effet "global" (alors qu'elle n'a en réalité un effet que chez les sujets Alzheimer) et que l'effet "global" du facteur "état du sujet" est significatif alors que seuls les Alzheimer "placebo" sont déficitaires.
Comment entrer les données dans un logiciel
En règle générale, dans tous les bons logiciels, on crée 1 ligne (1 seule) par sujet (ce qui permet d'éviter de se tromper selon que l'on soit en présence de mesures répétées ou non.
Très souvent le nom des colonnes qui contiennent un nom de facteur qualitatif se terminent par "$" (ce qui signifie que la colonne va contenir des noms de groupes, pas des valeurs).
Interprétation de résultats
Exemple 1. Un exemple simple, 2 facteurs à 2 modalités...
Exemple 2. 2 facteurs à 2 modalités dont un facteur en mesures répétées. On aborde une subtilité des ANOVAs
(A suivre... : Exemple 3. 2 facteurs à plus de 2 modalités; un des deux facteurs est en mesures répétées.)
Pour apprendre à interpréter, on pourra également consulter "Notion d'interactions statistiques entre deux variables".
Les indications supplémentaires données par quelques logiciels
Que faire après
L'ANOVA (analyse de variance, ou ANalysis Of VAriance) à 2 ou 3 facteurs est l'outil qui sert à mettre les interactions en évidence. On parle d'interaction entre deux facteurs lorsque "l'effet d'un facteur n'a pas le même effet sur la variable dépendante selon les modalités de l'autre facteur" (phrase magique). Dans le cas de mesures répétées, c'est lorsque l'on observe une "différence d'évolution de la VD selon les modalités de l'autre facteur"; le premier facteur étant un facteur permettant l'utilisation de mesures répétées. Une interaction entre 3 facteurs signifie que "l'amplitude de l'interaction entre deux facteurs change selon les modalités du troisième facteur"... Seuls des exemples concrets permettent de bien comprendre. Enfin, à partir de 4 facteurs, soit l'analyse résulte d'un plan expérimental mal planifié au départ et devient pratiquement ininterprétable, soit elle est volontaire, son plan expérimental a été réfléchi globalement par un chercheur qui maîtrise parfaitement à la fois ce type d'analyse et son sujet de recherche et donc, ce blog lui est inutile !
Cette page aborde :
- généralités,
- les aspects contre-intuitifs de l'ANOVA à 2 (et plus de 2) facteurs,
- comment entrer les données dans un logiciel,
- comment interpréter ce qui sort du logiciel stat à partir d'exemples,
- les indications supplémentaires données par quelques logiciels,
- que faire après.
Généralités
Une ANOVA à 2 facteurs donnera trois types de résultats :
- l'effet global du premier facteur,
- l'effet global du second facteur,
- l'interaction entre les deux facteurs
(une ANOVA à 3 facteurs donnera sept types de résultats : les effets globaux des 3 facteurs, les interactions entre les facteurs 1 et 2, 2 et 3, 1 et 3, et l'interaction entre les facteurs 1, 2 et 3; une ANOVA à 4 facteurs donnera... 15 (QUINZE) types de résultats... mais vous aurez eu l'intelligence de ne pas dépasser 3 facteurs).
L'aspect contre-intuitif de l'ANOVA à plusieurs facteurs
Lorsque l'on a compris la notion d'interaction, le seul problème est de comprendre ce qu'est un "effet global". L'effet global est un effet moyen qui tient compte du nombre de sujets des échantillons mais pas de celui de la population.
Exemple
J'étudie l'effet d'un anti-amnésiant destiné à pallier un déficit lié à la maladie d'Alzheimer. Celui-ci a un effet chez les patients Alzheimer de 55-60 ans, mais pas chez des sujets non Alzheimer du même âge.
En Bleu : sujets sains; en rose : sujets Alzheimer
Intuitivement, on a envie de dire en voyant le graphique, que la substance a un effet promnésiant uniquement chez les sujets Alzheimer; que les sujets Alzheimer non traités ont des performances mnésiques inférieures aux autres, et c'est tout.
L'ANOVA dira qu'il y a interaction entre l'état du sujet (Alzheimer ou sain) et la prise de la substance (substance ou placebo); c'est ce qui traduit l'idée que "la substance a un effet promnésiant uniquement chez les sujets Alzheimer". Mais elle dira peut-être aussi que la substance a un effet "global" (alors qu'elle n'a en réalité un effet que chez les sujets Alzheimer) et que l'effet "global" du facteur "état du sujet" est significatif alors que seuls les Alzheimer "placebo" sont déficitaires.
Comment entrer les données dans un logiciel
En règle générale, dans tous les bons logiciels, on crée 1 ligne (1 seule) par sujet (ce qui permet d'éviter de se tromper selon que l'on soit en présence de mesures répétées ou non.
Très souvent le nom des colonnes qui contiennent un nom de facteur qualitatif se terminent par "$" (ce qui signifie que la colonne va contenir des noms de groupes, pas des valeurs).
Interprétation de résultats
Exemple 1. Un exemple simple, 2 facteurs à 2 modalités...
Exemple 2. 2 facteurs à 2 modalités dont un facteur en mesures répétées. On aborde une subtilité des ANOVAs
(A suivre... : Exemple 3. 2 facteurs à plus de 2 modalités; un des deux facteurs est en mesures répétées.)
Pour apprendre à interpréter, on pourra également consulter "Notion d'interactions statistiques entre deux variables".
Les indications supplémentaires données par quelques logiciels
Que faire après
Retour aux articles de la catégorie Stats : choisir son test -
⨯
Inscrivez-vous au blog
Soyez prévenu par email des prochaines mises à jour
Rejoignez les 75 autres membres