Das Ende des Zufalls - Wie Big Data uns und unser Leben vorhersagbar macht (German Edition)
Google-Chef-Economist, Hal Varian.
Der Name Kaggle war übrigens das Produkt einer Namenssuche mit einem Webtool namens „Brute Force Naming“, das sie selbst entwickelt hatten. Es ermöglichte, Grundparameter für einen gesuchten Namen einzugeben, und dann wurden mithilfe eines Algorithmus einfach alle theoretisch möglichen Variationen dieser Parameter durchgespielt und gecheckt, welche Lösungen auch als Domain noch verfügbar sind. In ein paar Sekunden hatte man eine ganze Reihe von Vorschlägen. Schon der Name von Kaggle ist also datengetrieben entstanden. Das Tool ist heute nicht mehr online.
Anthony Goldbloom und Jeremy Howard übersiedelten nach dieser Finanzierungsrunde Ende 2011 mit Kaggle nach San Francisco. Goldblooms Vorhersage, dass Kaggle eine Win-Win-Lösung für alle sei, schien sich zu bewahrheiten. Unternehmen bekommen für einen relativ geringen Einsatz bessere Lösungen, und die Datenspezialisten, die sich rund um die Welt in ihrer Freizeit mit den Problemen beschäftigen und sie lösen, können dennoch mehr verdienen als in ihren angestammten Jobs – viele sind ja im strengen Sinn ohnehin Amateure.
Goldblooms Vision ist, dass die besten Datenspezialisten mit Kaggle mehr als 50 Millionen Dollar im Jahr verdienen werden, so viel jedenfalls wie gute Hedgefonds-Manager oder Spitzensportler. Um den Wettbewerb während der Laufzeit der Bewerbe weiter anzuregen, veröffentlicht Kaggle Ranglisten der jeweils führenden Vorschläge. So werden alle Teilnehmer motiviert, die eigenen Lösungsvorschläge weiter zu verbessern, um in den Ranglisten aufzusteigen. Für diese Evaluierung wird nur ein Teil des jeweiligen Datenmaterials eingesetzt, sodass das Rennen spannend bleibt, da ja in der Schlussrunde unter Einsatz des gesamten Materials theoretisch noch Verschiebungen auftreten könnten.
Ende 2012 hatte Kaggle schon 60.000 Datenspezialisten weltweit: Mathematiker, Statistiker, Computer- und Wirtschaftswissenschaftler, Profis wie auch Amateure in den jeweiligen Sektoren. Viele namhafte Unternehmen und Organisationen, wie zum Beispiel die NASA oder Wikipedia, haben Partnerschaften mit Kaggle, und viele wissenschaftliche Arbeiten wurden auf der Basis von durchgeführten Wettbewerben veröffentlicht.
Die Heritage Challenge: Wann werden Sie das nächste Mal im Spital sein und wie lange?
„Heritage Health Prize“ ist das bisher größte Kaggle-Projekt, das auch weltweites Medienecho bekommen hat. 1480 Teams nehmen daran teil, der Bewerb läuft über zwei Jahre bis zum 4. April 2013. Bis Ende 2012 wurden von den Teams insgesamt über 27.000 Lösungsvorschläge eingereicht. Auftraggeber ist das Unternehmen „Heritage Provider Network“ (HPN), eine große US-Versicherungsfirma. Der Auftrag, was aus den zur Verfügung gestellten Daten mithilfe eines neuen Algorithmus errechnet werden soll, ist klar und unmissverständlich: Identifizieren Sie Patienten, die innerhalb des nächsten Jahres in ein Spital eingeliefert werden müssen, und deren Aufenthaltsdauer im Spital. Zur Verfügung stehen die historischen Patientendaten und die Daten der verrechneten medizinischen Leistung. Neben Preisen für die drei Teilabschnitte des Bewerbs winkt ein Hauptpreis von 3.000.000 Dollar. 50
Jeremy Howard ist heute Präsident und Chief-Scientist von Kaggle. Seine Zusammenfassung des Erfolgsgeheimnisses ist deshalb besonders interessant, weil sie einige der Grundsätze anspricht, die für die Nutzung von Big Data über das Kaggle-Modell hinaus generell gelten. „Der Wettbewerbseffekt ist sehr wichtig“, meint Howard. Er kenne mit Ausnahme des Profi-Sports weltweit kein anderes Betätigungsfeld, in dem man derart harsches, rohes, ungeschminktes Feedback bekommt. Es ist ein evolutionärer Prozess, es geht ums Überleben der Fittesten – und das live vor unseren Augen. Der Unterschied zwischen den guten und schlechten Teilnehmern an den Wettbewerben hängt nur davon ab, welche Daten sie wie in das Rechenmodell füttern, das sie entwickeln.
Die Gewinner von Kaggle-Wettbewerben sind neugierige und kreative Leute. Sie finden ein Dutzend neuer, unbeschrittener Wege, über ein Problem nachzudenken – und es zu lösen. Das Nette an den Algorithmen ist, dass man sie immer wieder mit verrückten Ideen füttern kann und sie emotionslos und unbestechlich herausfinden, welche davon funktionieren.
Nate Silver rechnet in seinem Buch „The Signal and the Noise“ mit dem klassischen Expertentum ab und fragt, ob im Zeitalter
Weitere Kostenlose Bücher