Existe-t-il une transformation appropriée ?
Vos connaissances de la variable dépendante vous laissent supposer que celle-ci ne suit pas une distribution normale.
Il vous reste une chance de pouvoir appliquer les tests les plus puissants qui existent : "transformer votre VD", ce qui ne signifie pas "bidouiller vos résultats".
Transformer votre VD consiste à appliquer aux valeurs de chaque individu de chaque groupe une transformation mathématique. Par exemple, on calculera la racine carrée de chacune de ces valeurs et c'est cette racine carrée qui sera utilisée dans vos tests statistiques. On dira que la transformation est appropriée si la VD transformée suit une loi normale.
En pratique, on trouve deux situations qui nécessitent régulièrement une transformation de la VD :
- Lorsque la distribution est théoriquement limitée par le bas, et que cette limite affecte réellement les résultats.
Solution : on essaie une transformation racine carrée (valeurs transformées = racine carrée des valeurs originales); si ce n'est pas suffisant pour rendre la distribution symétrique, on tente une transformation logarithmique (valeurs transformées = log des valeurs originales. Eventuellement, on peut faire "valeurs transformées = log des (valeurs originales + 1)" si la VD peut prendre la valeur "0"). Avec un tableur, c'est un jeu d'enfant. Une fois la transformation effectuée, on regarde si la distribution est devenue symétrique.
- Lorsque la distribution est théoriquement limitée par le bas et par le haut, et que ces limites affectent réellement les résultats.
Solution : valeurs transformées = arcsinus de la racine carrée des valeurs originales. Pas de panique ! avec un tableur, c'est un jeu d'enfant. Regardez le mode opératoire ci-dessous.
Explications ci-dessous
----------------------------------------------
Distribution théoriquement limitée par le bas
Exemple :
Temps de parcours (c'est la VD) d'une allée de 60 cm de long pour des souris qui vont chercher une récompense à l'autre extrémité.
La porte du compartiment de départ s'ouvre. La souris ne peut pas atteindre la récompense avant l'ouverture de la porte; c'est la limite par le bas théorique : 0 s.
Mais il faut un temps minimum pour atteindre la récompense. La souris la plus vive arrivera en moins d'une seconde, un grand nombre arrivera en environ 1,3 secondes, les plus lentes arriveront en 2 secondes environ, et celles qui voulaient explorer ou dormir un peu pourront mettre 30 s voire plusieurs minutes, mais celles-ci sont très rares.
Dans ce cas la limite par le bas affecte réellement la distribution de la VD.
Admettons que l'allée fasse 20m (ce qui n'existe pas dans les laboratoires). Aucune souris ne fera le trajet d'une seule traite. La limite par le bas n'affectera alors plus la distribution de la VD. On peut alors s'attendre à avoir une distribution normale de la VD sans transformation.
Distribution théoriquement limitée par le bas et par le haut
Exemple :
Pourcentage de réussites par séance (VD) au cours d'un apprentissage. Chaque séance fait 20 essais auxquels les souris peuvent réussir, soit perdre. Une souris qui répond au hasard a 3 chances sur 8 de réussites (probabilité = 3/8 = 0,375)
Les souris qui ne connaissent pas la règle du jeu vont devoir la découvrir : c'est l'apprentissage.
Au premier jour d'apprentissage, elles répondent au hasard et vont faire en moyenne 7,5 réussites. Les terriblement malchanceuses n'auront aucune réussite, mais ce sera excessivement rare (8,27 chances sur 100000). Les terriblement chanceuses n'auront que des réussites, mais ce sera excessivement rare (3 chances sur 1 milliard). Autant dire que ces limites par le haut et par le bas ne sont que théoriques, on peut s'attendre à obtenir une distribution à peu près symétrique et normale au premier jour d'apprentissage.
Après plusieurs jours d'apprentissage, les souris auront appris la tâche, choisiront préférentiellement les bras du labyrinthe où sont situées les récompenses, mais utiliseront 1, 2 ou 3 essais pour se promener dans les bras sans récompenses ou pour vérifier qu'il n'y en a toujours pas. Le groupe aura alors de nombreuses souris qui font 18 ou 19 réussites, peu qui en feront 20, et quelques unes qui n'auront toujours rien appris ou qui auront plus envie de se promener que les autres. La limite supérieure de la VD a alors un effet réel sur la symétrie de la distribution.
Enfin, des traitements anxiogènes peuvent les conduire à éviter les bras avec récompense. Dans ce cas, c'est la limite inférieure qui aura un effet réel.
Si l'une de ces deux dernières situations se présente, on sera amené à effectuer la transformation arcsin de racine de la VD sur tous les groupes et conditions participant à l'expérience (même sur le premier jour durant lequel on observait une distribution normale).
Au préalable, il faut exprimer le nombre de réussites en pourcentage (allant de 0 à 1). Par exemple 15 réussite = 15/20 = 0,75. On calcule ensuite arc sin de racine de 0,75. Avec un tableur, on trouve 1,047
(Mettez votre VD brute en colonne A; inscrivez 0,75 dans la cellule A1, collez la fonction "=ASIN(RACINE(A1))" dans la cellule B1; 1,047... s'affiche dans la cellule B1.)
Applications ci-dessous
----------------------------------------------
Voici les valeurs d'une VD
1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 7, 7, 8, 8, 10, 12, 16, 20
Tracez en la distribution; est-elle normale ?
Utilisez un tableur (MsExcel, OpenCalc...) pour effectuer une transformation racine carrée (fonction "=RACINE(cellule)"). Tracez la distribution de la variable transformée. Comparez la à la précédente.
Effectuez une transformation log (fonction "=LOG10(cellule)"). Tracez la distribution de la variable transformée. Comparez-la aux deux précédentes.
Il vous reste une chance de pouvoir appliquer les tests les plus puissants qui existent : "transformer votre VD", ce qui ne signifie pas "bidouiller vos résultats".
Transformer votre VD consiste à appliquer aux valeurs de chaque individu de chaque groupe une transformation mathématique. Par exemple, on calculera la racine carrée de chacune de ces valeurs et c'est cette racine carrée qui sera utilisée dans vos tests statistiques. On dira que la transformation est appropriée si la VD transformée suit une loi normale.
En pratique, on trouve deux situations qui nécessitent régulièrement une transformation de la VD :
- Lorsque la distribution est théoriquement limitée par le bas, et que cette limite affecte réellement les résultats.
Solution : on essaie une transformation racine carrée (valeurs transformées = racine carrée des valeurs originales); si ce n'est pas suffisant pour rendre la distribution symétrique, on tente une transformation logarithmique (valeurs transformées = log des valeurs originales. Eventuellement, on peut faire "valeurs transformées = log des (valeurs originales + 1)" si la VD peut prendre la valeur "0"). Avec un tableur, c'est un jeu d'enfant. Une fois la transformation effectuée, on regarde si la distribution est devenue symétrique.
- Lorsque la distribution est théoriquement limitée par le bas et par le haut, et que ces limites affectent réellement les résultats.
Solution : valeurs transformées = arcsinus de la racine carrée des valeurs originales. Pas de panique ! avec un tableur, c'est un jeu d'enfant. Regardez le mode opératoire ci-dessous.
Explications ci-dessous
----------------------------------------------
Distribution théoriquement limitée par le bas
Exemple :
Temps de parcours (c'est la VD) d'une allée de 60 cm de long pour des souris qui vont chercher une récompense à l'autre extrémité.
La porte du compartiment de départ s'ouvre. La souris ne peut pas atteindre la récompense avant l'ouverture de la porte; c'est la limite par le bas théorique : 0 s.
Mais il faut un temps minimum pour atteindre la récompense. La souris la plus vive arrivera en moins d'une seconde, un grand nombre arrivera en environ 1,3 secondes, les plus lentes arriveront en 2 secondes environ, et celles qui voulaient explorer ou dormir un peu pourront mettre 30 s voire plusieurs minutes, mais celles-ci sont très rares.
Dans ce cas la limite par le bas affecte réellement la distribution de la VD.
Admettons que l'allée fasse 20m (ce qui n'existe pas dans les laboratoires). Aucune souris ne fera le trajet d'une seule traite. La limite par le bas n'affectera alors plus la distribution de la VD. On peut alors s'attendre à avoir une distribution normale de la VD sans transformation.
Distribution théoriquement limitée par le bas et par le haut
Exemple :
Pourcentage de réussites par séance (VD) au cours d'un apprentissage. Chaque séance fait 20 essais auxquels les souris peuvent réussir, soit perdre. Une souris qui répond au hasard a 3 chances sur 8 de réussites (probabilité = 3/8 = 0,375)
Les souris qui ne connaissent pas la règle du jeu vont devoir la découvrir : c'est l'apprentissage.
Au premier jour d'apprentissage, elles répondent au hasard et vont faire en moyenne 7,5 réussites. Les terriblement malchanceuses n'auront aucune réussite, mais ce sera excessivement rare (8,27 chances sur 100000). Les terriblement chanceuses n'auront que des réussites, mais ce sera excessivement rare (3 chances sur 1 milliard). Autant dire que ces limites par le haut et par le bas ne sont que théoriques, on peut s'attendre à obtenir une distribution à peu près symétrique et normale au premier jour d'apprentissage.
Après plusieurs jours d'apprentissage, les souris auront appris la tâche, choisiront préférentiellement les bras du labyrinthe où sont situées les récompenses, mais utiliseront 1, 2 ou 3 essais pour se promener dans les bras sans récompenses ou pour vérifier qu'il n'y en a toujours pas. Le groupe aura alors de nombreuses souris qui font 18 ou 19 réussites, peu qui en feront 20, et quelques unes qui n'auront toujours rien appris ou qui auront plus envie de se promener que les autres. La limite supérieure de la VD a alors un effet réel sur la symétrie de la distribution.
Enfin, des traitements anxiogènes peuvent les conduire à éviter les bras avec récompense. Dans ce cas, c'est la limite inférieure qui aura un effet réel.
Si l'une de ces deux dernières situations se présente, on sera amené à effectuer la transformation arcsin de racine de la VD sur tous les groupes et conditions participant à l'expérience (même sur le premier jour durant lequel on observait une distribution normale).
Au préalable, il faut exprimer le nombre de réussites en pourcentage (allant de 0 à 1). Par exemple 15 réussite = 15/20 = 0,75. On calcule ensuite arc sin de racine de 0,75. Avec un tableur, on trouve 1,047
(Mettez votre VD brute en colonne A; inscrivez 0,75 dans la cellule A1, collez la fonction "=ASIN(RACINE(A1))" dans la cellule B1; 1,047... s'affiche dans la cellule B1.)
Applications ci-dessous
----------------------------------------------
Voici les valeurs d'une VD
1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 7, 7, 8, 8, 10, 12, 16, 20
Tracez en la distribution; est-elle normale ?
Utilisez un tableur (MsExcel, OpenCalc...) pour effectuer une transformation racine carrée (fonction "=RACINE(cellule)"). Tracez la distribution de la variable transformée. Comparez la à la précédente.
Effectuez une transformation log (fonction "=LOG10(cellule)"). Tracez la distribution de la variable transformée. Comparez-la aux deux précédentes.
A découvrir aussi
Retour aux articles de la catégorie Stats : choisir son test -
⨯
Inscrivez-vous au blog
Soyez prévenu par email des prochaines mises à jour
Rejoignez les 75 autres membres