Das Ende des Zufalls - Wie Big Data uns und unser Leben vorhersagbar macht (German Edition)
Freunden der Freunde auf Facebook, Twitter oder anderen sozialen Netzwerken.
1989 gründeten Edwina Dunn und Clive Humby ihre Marketing-Agentur Dunnhumby. Zunächst arbeitete das Paar aus der Küche der gemeinsamen Wohnung. Doch schon bald standen auf der Kundenliste Namen wie Cable&Wireless oder BMW. 1994 verblüffte eine Dunnhumby-Analyse der Kundendaten von Tesco, einer der größten Handelsketten der Welt, den damaligen Tesco-CEO-Lord Ian MacLaurin. „Es erschreckt mich“, meinte er, „dass die beiden nach drei Monaten mehr über meine Kunden wissen als ich nach 30 Jahren“. Die junge Agentur konnte Tesco als Kunden gewinnen, und bald kaufte sich die Handelskette bei der Agentur ein. Heute gehört Dunnhumby zu 81 Prozent Tesco.
Dass die Agentur Dunnhumby aus London und Alexander D’yakonov, Professor für Mathematik an der Staatsuniversität in Moskau, miteinander in Kontakt kommen, wäre wohl purer Zufall. Der russische Mathematiker hat für die englische Agentur ein wichtiges Werkzeug entwickelt, einen Algorithmus, der vorhersagen kann, wann und wo ein Supermarktkunde das nächste Mal einkaufen gehen wird – und wie viel er dabei ausgibt. Vermittler zwischen den beiden war in unserem Fall aber nicht der Zufall, sondern die Crowdsourcing-Plattform Kaggle, auf der Top-Wissenschaftler nach interessanten Problemen Ausschau halten, die sie lösen könnten. 45
Tesco ist eine britische, weltweit agierende Supermarktkette, die es sich zum Ziel gesetzt hat, besonders preisgünstig zu sein. Fast 500.000 Mitarbeiter sind in über 5000 Filialen für Tesco tätig. Um herauszufinden, wie das Kaufverhalten der Kunden vorhersagbar wird, ist die Agentur von Tesco einen neuen Weg gegangen – den Big-Data-Weg: Sie nutzte die gerade beschriebene Internet-Plattform namens Kaggle, auf der Mathematiker und Statistiker versuchen, in Wettbewerben gegeneinander den besten Algorithmus für die jeweils gestellte Aufgabe zu entwickeln. Auf dieser Plattform präsentieren Firmen, Regierungen und Forscher ihre Probleme, und überall auf der Welt können Data-Wissenschaftler sich in Form von Wettbewerben an deren Lösung beteiligen. Am Ende des Wettbewerbs kann die Firma auf eine Vielzahl von Lösungsmöglichkeiten zurückgreifen. Der Sieger bekommt Geld und die Firma die Lösung des Problems.
Die Dunnhumby Shopper Challenge auf Kaggle
• Entwickle ein Modell, um vorauszusagen, wann ein Supermarktkunde das nächste Mal einkauft und wie viel er dabei ausgeben wird.
• Das zur Verfügung stehende Datenset besteht aus den Details aller Einkäufe von 100.000 Kunden in einem Jahr.
• Jeder Besuch ist mit dem Zeitpunkt und der jeweiligen Umsatzsumme dokumentiert.
• Die Vorhersage für den jeweiligen Kunden gilt als korrekt, wenn das Datum des nächsten Einkaufs richtig vorhergesagt wird und die Vorhersage des richtigen Umsatzes in einem Bereich von +/- 10 Dollar getroffen wurde.
• Sieger ist, wer die höchste Anzahl an korrekten Vorhersagen macht.
• Die Preise betragen 6000 Dollar für den ersten, 3000 Dollar für den zweiten und 1000 Dollar für den dritten Platz.
Das Interesse der Datenwissenschaftler rund um den Globus war groß. Insgesamt 279 Einzelpersonen oder Teams beteiligten sich an dem Wettbewerb. Sieger wurde aber kein Amerikaner, auch kein Europäer, sondern der 35-jährige Russe Alexander D’yakonov, dessen Website das schöne Motto „Illusion ist das größte aller Vergnügen“ ziert. Seinem Algorithmus gelang es, das Kaufverhalten der untersuchten Kunden um 208 Prozent besser vorherzusagen als die bisherigen Modelle von Tesco. 46
„Wir machen Datenwissenschaft zu einem Sport“ –
Kaggle, das Big-Data-Wunderkind
2008 gewann der junge Australier Anthony Goldbloom, damals gerade Mitte 20 und als Statistiker im australischen Finanzministerium tätig, einen Aufsatzwettbewerb des Wirtschaftsmagazins „The Economist“. Der Preis war ein dreimonatiges Praktikum, in dessen Rahmen Goldbloom zu einem selbst gewählten Thema recherchieren sollte. Er entschied sich für das Thema Big Data, weil das damals sonst niemand in der Redaktion machen wollte. Das noch weithin unbekannte Thema faszinierte Goldbloom und ließ ihn nicht mehr los. „Meine Frau kann bezeugen, dass ich von diesem Praktikum zurückkam und komplett besessen war von der Big-Data-Idee“, erinnert er sich in einem Interview mit dem US-Magazin „FastCompany“. 47
Goldbloom erkannte, dass die meisten
Weitere Kostenlose Bücher