Première solution : inventons la roulette de Monte-Carlo
Notre expérience précédente était basée sur deux groupes de 5 sujets (des souris, par exemple). Comment savoir quelle est la probabilité pour obtenir par hasard la différence de moyenne que nous avons observée entre les deux groupes ?
Nous sommes des utilisateurs des stats, pas des matheux, donc on ne sait pas, mais on a des idées.
Admettons que nous puissions disposer de la population entière des souris de la terre. Prenons au hasard dans cette population deux groupes de 5 souris : les groupes a et b. On leur fait passer le test de mémoire. On peut alors calculer la différence entre les moyennes de ces deux groupes. Cette différence de moyenne est due au hasard car les deux groupes ont été constitués au hasard et qu'aucun traitement n'a été donné. On peut voir si la différence de moyenne de ces deus groupes est plus grande ou plus petite que celle que nous avons observée, mais on sent qu'il est gênant de tirer une conclusion. Inscrivons la plutôt quelque part et recommençons. Recommençons encore. Recommençons 1000 fois et inscrivons ces différences de moyennes à chaque fois.
Lorsque nous avons environ 1000 différences de moyennes obtenues par hasard, on peut les classer par ordre croissant et regarder où se situe la différence de moyennes observée entre notre groupe traité et notre groupe témoin.
On compte alors le nombre de différences de moyennes qui dépassent celle que nous avons observé dans notre expérience. Cela nous permet de dire par exemple "il y a 35 % de chances que le hasard conduise à une différence de moyenne égale ou plus importante que celle que j'ai observée dans mon expérience". Ou alors : "il y a 0,6 % de chances que le hasard conduise à une différence de moyenne égale ou plus importante que celle que j'ai observée dans mon expérience". Par convention on considérera que s'il y a 5% ou moins de 5% de chances que le résultat obtenu soit du au hasard, la substance promnésiante sera considérée comme efficace. Dans le cas contraire, on considérera qu'il y a trop de risques qu'une telle différence soit obtenue par hasard pour pouvoir l'attribuer à la substance.
Si vous n'avez pas compris cette explication, relisez la, méditez la. Si vous ne la comprenez toujours pas posez vos questions ci-dessous en précisant ce qui coince.
Si vous l'avez comprise : félicitations, vous venez de comprendre la moitié de toutes les statistiques.
Et Monte-Carlo, dans tout ça ? Avec quelques variantes minimes qui vous évitent de capturer toutes les souris de la terre, la méthode que vous venez de comprendre s'appelle la méthode de Monte-Carlo (en référence aux roulettes qui tournent en permanence dans cette principauté pour générer des résultats au hasard). Avec d'autres variantes minimes, nous arrivons à la méthode du "bootstrap", mais ceci est une autre histoire.
Page suivante : Deuxième solution : les statistiques
Page précédente : La question que l'on se pose
Retour au plan
A découvrir aussi
Inscrivez-vous au blog
Soyez prévenu par email des prochaines mises à jour
Rejoignez les 75 autres membres