Nehmen wir ein anderes Beispiel: In der Schweiz sind seit dem Zweiten Weltkrieg sowohl die Anzahl Störche wie auch die Anzahl Babys pro Familie zurückgegangen. Beweist das, dass es eben doch die Störche sind, die die Babys bringen – so wie man früher glaubte? Nein, das tut es nicht. Dass heute weniger Störche auf unseren Dächern klappern ist zwar traurig. Aber es ist nicht die Ursache dafür, dass weniger Kinder geboren werden.
Der Harvard-Student Tyler Vigen hat eine ganze Serie von solchen kuriosen Scheinkorrelationen aufgespürt. Viele davon sind zum totlachen. Aber sie belegen auch ein Problem, das Statistiker gut kennen. Es lautet: "Korrelation ist nicht Kausalität". Der Zusammenhang zwischen zwei Dingen heisst noch lange nicht, dass das eine das andere bewirkt.
Es gibt in der Informatik einen hübschen Merksatz: "Garbage in, garbage out" Auf Deutsch heisst das so viel wie: "Mist rein, Mist raus". Auf Big Data bezogen bedeutet es: Wie aussagekräftig das Resultat ist, das ein Algorithmus liefert, kommt nicht nur auf die Daten an, mit denen er gefüttert wird. Sondern auch darauf, ob er so programmiert ist, dass er die richtigen Parameter berechnet.