B00BOAFYL0 EBOK
Erfolgswahrscheinlichkeit ist ein solches Ergebnis durchaus möglich. Was tun Menschen, um zu überleben? Sie versuchen ihre Überlebenswahrscheinlichkeit zu erhöhen, indem sie auf schwarze Schwäne setzen (wie John und Carlos). Damit fahren sie die meiste Zeit über gut, gehen aber zugleich das Risiko eines völligen Fiaskos ein.
Das Geburtstagsparadox
Am eingängigsten lässt sich das Data-Mining-Problem einem statistischen Laien anhand des so genannten »Geburtstagsparadox« veranschaulichen, obwohl es sich hier streng genommen nicht um ein Paradoxon, sondern einfach nur um eine Kuriosität in unserer Wahrnehmung handelt. Bei einer Zufallsbekanntschaft liegt die Wahrscheinlichkeit, dass Sie beide am gleichen Tag Geburtstag haben, bei 1 zu 365,25. Die Wahrscheinlichkeit, dass dieser identische Geburtstag auch ins gleiche Jahr fällt, ist weitaus geringer. Wenn Sie also am gleichen Tag Geburtstag hätten, wäre das ein zufälliges Ereignis, über das Sie sich beim Abendessen unterhalten würden. Nehmen wir jetzt an, es befinden sich 23 Personen in einem Raum. Wie groß ist die Wahrscheinlichkeit, dass zwei von ihnen am gleichen Tag Geburtstag haben? Ungefähr 50 Prozent. Denn wenn wir nicht näher spezifizieren, welche zwei Personen am gleichen Tag ihren Geburtstag feiern sollen, erfüllt jedes Paar die Bedingungen.
Die Welt ist ein Dorf!
Eine ähnlich falsche Vorstellung von Wahrscheinlichkeiten leiten wir aus zufälligen Begegnungen mit Verwandten oder Freunden an höchst unerwarteten Orten ab. Bei einer solchen Gelegenheiten rufen wir oft überrascht: »Die Welt ist ein Dorf!« Aber derartige Zusammentreffen sind keineswegs unwahrscheinlich – und die Welt ist sehr viel größer, als wir meinen. Wir rechnen nur in Wahrheit nicht aus, wie groß die Wahrscheinlichkeit ist, eine bestimmte Person zu einer bestimmten Zeit an einem bestimmten Ort zu treffen. Vielmehr testen wir das einfach für jede Begegnung mit jeder Person, die wir jemals in der Vergangenheit kennen gelernt haben, und für jeden Ort, den wir während des betreffenden Zeitraums besuchen. Letzteres ist viel wahrscheinlicher – vielleicht mehrere tausend Mal so wahrscheinlich wie der zuerst beschriebene Fall.
Wenn ein Statistiker sich Daten ansieht, um eine gegebene Beziehung zu überprüfen – etwa um eine Korrelation zwischen dem Eintritt eines bestimmten Ereignisses wie einer politischen Ankündigung und der Volatilität des Aktienmarktes aufzuzeigen –, können die Ergebnisse mit größerer Wahrscheinlichkeit ernst genommen werden. Wenn man aber die Daten durch den Computer jagt und einfach nach irgendeiner Beziehung sucht, wird mit Sicherheit eine falsche Kausalität dargestellt – zum Beispiel eine Verknüpfung zwischen dem Wohl und Wehe der Börse und der Länge von Damenröcken. Und wie die zufällige Übereinstimmung der Geburtstage wird dies die Menschen in Erstaunen versetzen.
Data Mining, Statistik und Scharlatanerie
Wie groß ist die Wahrscheinlichkeit, dass Sie zwei Mal im Lotto gewinnen? Eins zu 17 Billionen. Dennoch passierte genau dies Evelyn Adams aus New Jersey, die sich – wie der Leser wohl vermuten würde – als vom Schicksal besonders begünstigt fühlen sollte. Mit der oben entwickelten Methode schätzten die Forscher Percy Diaconis und Frederick Mosteller aber, dass die Wahrscheinlichkeit, dass irgendjemand irgendwo auf vollkommen unspezifizierte Weise ein solcher Glückspilz wird, bei 30 zu 1 liegt!
Manche Menschen dehnen ihr Data Mining auf die Theologie aus – schließlich lasen die Mittelmeervölker der Antike mächtige Botschaften in den Eingeweiden von Vögeln. Eine interessante Ausweitung des Data Mining auf die biblische Auslegung liefert Michael Drosnin in Der Bibel-Code. Unterstützt von der Arbeit eines »Mathematikers« half Drosnin, ein ehemaliger Journalist (der scheinbar keinerlei statistische Ausbildung genossen hat), das Attentat auf den ehemaligen israelischen Premierminister Yitzhak Rabin durch Entschlüsselung eines Codes in der Bibel »vorherzusagen«. Er informierte Rabin, der ihn offenbar nicht allzu ernst nahm. Der Bibel-Code identifiziert in der Bibel statistische Unregelmäßigkeiten, mit deren Hilfe einige Ereignisse dieser Art vorhergesagt wurden. Es versteht sich von selbst, dass dieses Buch viele Abnehmer fand – so viele, dass in einem Fortsetzungsband rückblickend weitere solche Ereignisse prognostiziert wurden.
Der gleiche Mechanismus liegt Verschwörungstheorien
Weitere Kostenlose Bücher