Plan

Méthodologie de l'expérimentation et statistiques

Pour le code couleur, cf. en bas de page.

N'hésitez pas à demander des éclaircissements grâce aux "Commentaires" que vous pouvez laisser. C'est anonyme et ça peut être utile, à vous, à vos successeurs et à moi aussi (la pédagogie sur le web est une discipline à inventer).

ATTENTION ! Le plus difficile de cette formation aux "statistiques appliquées" va être...
d'oublier tout ce que vous avez appris en statistiques jusqu'à présent !

Objectifs de la formation

I - Première partie : Méthodologie de l'expérimentation
Dans cette partie, on apprend le strict minimum pour pouvoir concevoir une expérimentation permettant l'obtention de résultats qui peuvent être traités statistiquement. On apprend également le langage de base qui permet d'utiliser correctement les logiciels de statistique.

   1.0 Départ en voyage

   1.1 Déroulement d'une recherche

   1.2 A quelles étapes les statistiques sont-elles utiles ?

   1.3 Variables
Je n'ai pas envie de vous donner une définition de ce mot... ça pourrait vous dégouter des stats (définition très compliquée pour un terme très simple), alors je ne crée pas de page pour ce mot. Tout ce qui nous sera utile est dit par la suite.
Si vous y tenez, lisez Frontier et coll. (2001) Statistiques pour les sciences de la vie et de l'environnement. Dunod. et vous apprendrez à la première ligne du paragraphe 1.1.1 qu'une "quantité Y (notée en majuscule) qui, lorsque toutes les conditions contrôlables de son observation sont fixées, peut prendre plusieurs valeurs possibles sans qu'on puisse prévoir avec certitude laquelle va se réaliser, est appelée une variable aléatoire."... qui nous renvoie à une note stipulant que "Rigoureusement, on devrait plutôt parler de fonction aléatoire. En effet une grandeur Y est fonction d'un certain nombre de variables contrôlées x, y, z,..., exprimant les conditions d'observations fixées par l'observateur : Y=f[x,y,z,...]. Cette fonction f est ici aléatoire (c'est-à-dire faisant intervenir le "hasard") en ce sens que, les conditions de la mesure de Y (les valeurs des différentes variables contrôlées) étant données, elle ne prévoit pas la valeur de Y de façon univoque, mais ne permet d'en prévoir qu'un intervalle de valeurs possibles avec éventuellement, voir plus loin, leur probabilité."

      1.3.1 Typologie des variables en fonction de la quantité d'information véhiculée

      1.3.2 Statut des variables dans l'expérimentation

1.3.3. Intérêt de cette typologie et de la connaissance des statuts

1.3.4 Opérationnalisation des variables indépendantes en facteurs

1.3.5 Variables dont il faut contrôler l'effet

1.3.6 Concept complémentaire : les variables concomitantes

   1.4 Hypothèses, hypothèses fortes, hypothèses faibles

      1.4.1 Les types d'hypothèses lors d'une recherche

      1.4.2 Notion d'interaction statistique entre deux variables

      1.4.3 Interaction entre trois variables

II - Deuxième partie : Comprendre toutes les statistiques
La (quasi-?)totalité des statistiques est basée sur un seul et même raisonnement. Lorsqu'on a compris ce raisonnement, on peut s'attaquer à n'importe quel problème en statistiques, interpréter n'importe quel résultat, voir même créer ses propres tests... Nous pratiquons ce raisonnement dans la vie de tous les jours sans le savoir. Dans cette partie, nous tentons de prendre conscience de ce raisonnement et de le formaliser.

   2.1 La question que l'on se pose

   2.2 Première solution : la roulette de Monte-Carlo

   2.3 Deuxième solution : les statistiques

      2.3.1 Moyenne d'un échantillon et moyenne d'une population

      2.3.2 Indices de variabilité

         2.3.2.1 Les extrêmes

         2.3.2.2 La moyenne des écarts à la moyenne

         2.3.2.3 La variance

         2.3.2.4 L'écart type

         2.3.2.5 Variance de la population

         2.3.2.6 Ecart type de la population

         2.3.2.7 Coefficient de variation

         2.3.2.8 Erreur type

   2.4 Un trait de lumière sur le t de Student

   2.5 Hypothèses unilatérales et bilatérales

   2.6 Prendre un groupe comme son propre témoin

   2.7 Moralité : certains tests sont plus puissants que d'autres

III - Troisième partie : Utiliser les statistiques
Les objectifs de cette partie sont de nous acheminer progressivement vers une utilisation intelligente et donc rigoureuse des statistiques. En particulier, nous apprendrons à mener un raisonnement correct à partir de résultats statistiques et nous tenterons de sensibiliser aux "contraintes d'utilisation" des tests statistiques.

         3.1 Interpréter un t de Student

                  3.1.1 Les données du problème

                  3.1.2 Cas des calculs faits à la main

                  3.1.3 Cas des calculs faits par un logiciel

IV - Quatrième partie : La logique spécifique de l'analyse de variance

         4.1 La logique de l'analyse de variance

         4.2 Que faire après l'ANOVA ?

         4.3 Student / ANOVA : même combat !

         4.4 ANOVA : pour aller plus loin, et applications
                   - ANOVA à 2 facteurs : exemple 1
                   - ANOVA à 2 facteurs : exemple 2
                   - ANOVA à plusieurs facteurs
                   - MANOVA
                   - ANCOVA A faire

V - Cinquième partie : La logique spécifique des tests non paramétriques
Spécifique à la version Web... A faire

VI - Sixième partie : La logique spécifique des corrélations
Spécifique à la version Web...

         6.1 Relation positive ou négative : la covariance

         6.2 Mesurer la relation : la corrélation

         6.3 La corrélation sous un autre angle, et application

VII - Mises en situation
Ici seront présentés les exercices du reality show final de la formation PPC. On soumet un problème. Après cette formation on a tous les éléments pour l'analyser mais pas forcément ceux qui permettent de le résoudre. Les étudiants ont entre 8 et 48 heures pour analyser le problème, commencer à analyser les données, proposer des pistes de réponses, proposer un budget d'achat de livres et logiciels spécialisés, proposer la participation à des stages de formation spécialisées... Ils ont le droit de consulter des bouquins de stats, d'utiliser des logiciels, de téléphoner, d'utiliser internet, d'aller à la bibliothèque universitaire, au café... En général, il existe plusieurs réponses possibles, il faut en proposer, les analyser, proposer une combinaison de plusieurs méthodes, justifier et défendre le choix... Les étudiants ne sont cependant pas filmés.
6.2 - Reality show 2009

Suite du plan pour la version "Live"
Dans la version web, on en retrouvera le contenu dans la rubrique "Stats : choisir son test".
III - Troisième partie : comparaisons de moyennes par tests "paramétriques"
3.1 Comparaison d'une moyenne observée à une moyenne théorique
3.2 Comparaison de deux moyennes : clé de choix n°1
3.2.1 la population est-elle "normale" ?
3.2.2 Transformations de variables
3.2.3 Les échantillons sont-ils appariés ?
3.2.4 Taille des échantillons; t et z
3.2.5 Comparaison des variances : test de Snedecor
3.2.6 L'hypothèse est-elle forte ou faible ?
3.3 Effets d'un FPS à plusieurs modalités sur une VD (ANOVA à 1 facteur)
3.4 Effets de deux FPS sur une VD (ANOVA à 2 facteurs)
3.5 Effets de trois FPS sur une VD (ANOVA à 3 facteurs)
3.6 ANCOVA : les variables concomitantes3.7 MANOVA : comment découvrir des effets invisibles
IV - Quatrième partie : liaisons entre variables quantitatives
4.1 La covariance et ses propriétés
4.2 La corrélation et ses propriétés
4.3 Test de signification d'un coefficient de corrélation
4.4 Systèmes de causalité : corrélations partielles
4.5 La régression linéaire simple
4.6 Pour aller plus loin
V - Cinquième partie : tests non paramétriques
5.1 La différence avec les tests paramétriques
5.2 Nouveaux paramètres
5.3 Représentations graphiques
5.4 Utilisation de la clé de choix n°3

Classification des pistes :
- vertes : très faciles (ça ne s'invente pas). Les master 2, dont les PPC (Psychopharmacologie des Processus Cognitifs) peuvent se dispenser de la lecture de ces parties, ils ont mieux à faire. On y trouve une vulgarisation utilisant des analogies avec des sujets parlants.
- bleues : facile, mais pas inutiles.
- rouges : pas vraiment difficiles, mais contiennent des connaissances importantes ou indispensables. Le plus souvent, nécessitent la connaissance des bleues comme prérequis.
- noires : pas dangereuses, difficulté variable, mais l'importance de l'information qu'elles contiennent nécessitent une concentration importantes. En comprenant ces chapitres on comprend toutes les statistiques. Donc relisez les, vivez les, intégrez les...
- mauve : hors piste, aux risques et périls du lecteur.

14/01/2009

0 J'aime 0 Poster un commentaire

A découvrir aussi

Retour aux articles de la catégorie Méthodo et stats : comprendre -

⨯

Inscrivez-vous au blog

Soyez prévenu par email des prochaines mises à jour

Rejoignez les 76 autres membres

Plan

A découvrir aussi

Membres qui aiment ce contenu

Inscrivez-vous au blog