Pour sourire

Pour sourire (et plus si affinité) : corrélation n’est pas causalité

13 mai 2014

Tyler Vigen, un jeune scientifique travaillant pour l’armée américaine, sur son site « Fausses corrélations » (« spurious correlations » in English) publie en fait de vraies corrélations. Vraies, mais sans aucune signification.

Il le fait pour le plaisir et pour la pédagogie.

Il y a par exemple, entre 2000 et 2009, une corrélation très forte (0,94) entre la consommation de fromage aux USA et le nombre de personnes qui meurent étouffées dans leur lit.

Ou entre le taux de divorce dans l’Etat du Maine et la consommation de margarine aux USA.

Entre 1990 et 2009, la corrélation est fortement négative entre le nombre de ruches et le nombre de jeunes arrêtés pour possession de marijuana.

Il a ainsi établi plus de 17000 ( !!!) corrélations statistiques très fortes entre des phénomènes qui n’ont visiblement rien à voir… et en publie une par jour.

1405SpuriousCorrelations

En probabilité ou en statistiques, la corrélation est l’intensité de la liaison qui peut exister entre deux variables. Elle s’exprime par un nombre compris entre – 1 (quand la corrélation est fortement négative) et + 1 (quand elle est fortement positive). Voir article « corrélation » sur Wikipedia.

Mais attention : contrairement à une idée reçue, souvent exploitée par les marchands de peur, quand deux variables sont fortement corrélées, cela ne démontre pas une relation de causalité entre elles. Dans beaucoup de cas, cela peut indiquer par exemple une cause commune.

Dans une démarche scientifique, interpréter une corrélation demande toujours une extrême prudence.