Die Berechnung der Zukunft: Warum die meisten Prognosen falsch sind und manche trotzdem zutreffen - Der New York Times Bestseller (German Edition)

Titel: Die Berechnung der Zukunft: Warum die meisten Prognosen falsch sind und manche trotzdem zutreffen - Der New York Times Bestseller (German Edition) Kostenlos Bücher Online Lesen
Autoren: Nate Silver

Vom Netzwerk:

für stichhaltig ausgegeben werden, in Wirklichkeit falsch sind.
    Jedenfalls scheint Ioannidis’ Hypothese zu den wenigen wirklich wahren Hypothesen zu gehören. Etwa zwei Drittel der in der medizinischen Forschungsliteratur beschriebenen positiven Ergebnisse hatten sich in den Laboratorien von Bayer nicht nachvollziehen lassen. 41 Man kann den Wahrheitsgehalt solcher Forschungsergebnisse auch prüfen, indem man untersucht, ob sie sich für Prognosen in der realen Welt eignen. Wie wir bislang gesehen haben, ist das sehr oft nicht der Fall. Die Quote der Fehlprognosen auf den unterschiedlichsten Gebieten, von der Seismologie bis hin zur Politologie, scheint extrem hoch zu sein.
    »In den letzten zwanzig Jahren haben wir durch das exponentielle Wachstum der Informationsmenge, durch Genomik und andere Technologien, die Möglichkeit erhalten, Millionen und Abermillionen interessanter Variablen zu messen«, sagt Ioannidis. »Wir erwarten, dass wir diese Informationen für unsere Prognosen nutzbar machen können. Ich will zwar nicht behaupten, dass wir keine Fortschritte gemacht hätten. In Anbetracht der Tatsache, dass es mindestens zwei Millionen wissenschaftlicher Abhandlungen gibt, wäre das auch eine Schande, aber es handelt sich ganz offenbar nicht um zwei Millionen Entdeckungen. Die meisten tragen in Wirklichkeit nicht zur Wissenserweiterung bei.«
    Das ist der Grund, warum sich die Fehlprognosen in der Big-Data-Ära mehren . Es gibt einen exponentiellen Anstieg der Informationsmenge und gleichzeitig einen zahlenmäßig exponentiellen Anstieg der Hypothesen, die getestet werden müssen. Die US-Regierung veröffentlicht beispielsweise 45 000 Wirtschaftsstatistiken. Wenn man die Beziehungen von sämtlichen Paaren dieser Statistiken testen will, beispielweise ob eine Beziehung zwischen dem Leitzins und der Arbeitslosenquote in Alabama besteht, dann erhält man buchstäblich eine Milliarde Hypothesen (die Zahl möglicher Kombinationen beträgt 45 000 mal 44 999 geteilt durch 2 gleich 1 012 477 500).
    Aber die Zahl der sinnvollen Beziehungen in der Datenflut, bei denen es um Kausalität und nicht nur um Korrelationen geht, und die einem sagen, wie die Welt wirklich tickt, ist unendlich viel kleiner. Es ist auch nicht wahrscheinlich, dass sie so schnell zunimmt wie die Masse der Informationen. Es gibt nicht mehr Wahrheit auf der Welt als in der Zeit vor dem Internet oder vor der Druckerpresse. Beim überwiegenden Teil der Daten handelt es sich um bloßes Rauschen, so wie der größte Teil des Universums mit Leere gefüllt ist.

    Abbildung 8-6: Grafische Darstellung falsch positiver Befunde
    Das Bayes-Theorem hat uns doch gezeigt: Wenn die Häufigkeit eines Merkmals in der Bevölkerung sehr gering ist – wie etwa Brustkrebs bei jungen Frauen –, dann können, wenn wir nicht vorsichtig damit umgehen, falsch positive Befunde das Ergebnis dominieren. Abbildung 8-6 stellt das dar. (Wobei im Unterschied zur Darstellung ja noch hinzukommt, dass man in der Praxis die negativen Ergebnisse vermutlich in einer Schublade verschwinden lässt, statt sie zu veröffentlichen. Etwa 90 Prozent der Aufsätze in den heutigen wissenschaftlichen Zeitschriften dokumentieren positive und keine negativen Ergebnisse, was jedoch nichts am Problem der publizierten falsch positiven Ergebnisse ändert.) Warum ist die Fehlerquote so hoch? Dieses Buch gibt eine Antwort: Das hat viele Gründe, einige haben mit unserer psychologischen Voreingenommenheit zu tun, andere mit verbreiteten methodologischen Fehlern oder mit falscher Motivation. Die Wurzel des Problems ist jedoch ein falsches statistisches Denken in der Herangehensweise der Wissenschaftler.
    Als die Statistik Bayes den Rücken kehrte
    Derjenige, der es am ehesten mit Thomas Bayes aufnehmen kann, obwohl er erst 1890, fast 120 Jahre nach Bayes’ Tod zur Welt kam, ist der englische Statistiker und Biologe Ronald Aylmer Fisher. Fisher war ein viel schillernderer Zeitgenosse als Bayes und entsprach beinahe der englischen intellektuellen Tradition von Christopher Hitchens. Er war gut aussehend, kleidete sich jedoch nachlässig 42 und rauchte ständig Pfeife oder Zigaretten. Unentwegt legte er sich mit wirklichen oder eingebildeten Rivalen an. Seine Vorlesungen waren nur mittelmäßig, aber seine Schriften waren glänzend und zeigten ein Gespür für Dramatik. Bei Gesellschaften war er ein gern gesehener Gast. Fishers Interessen waren vielfältig. Er war einer der besten Biologen seiner Zeit