Die Datenfresser
Planwirtschaft, das die triste Realität in den ehemaligen sozialistischen Staaten so nachhaltig prägte, ist mit der Durchdigitalisierung des Wirtschaftsalltags etwas näher gerückt, wenn auch in ganz anderer Form, als es sich die Leninisten träumen ließen. Die Vorhersagemodelle dienen nun der Steigerung des Gewinns und der effizienten Ausnutzung der menschlichen Arbeitskraft. Das Herausoptimieren von Entscheidungsspielräumen, Handlungsalternativen und menschlichem Ermessen aus Geschäftsprozessen – gerade bei niedrig entlohnten Tätigkeiten – führt zu besserer Vorhersagbarkeit und Planbarkeit. Umgekehrt werden zwangsläufig alle Berufe, die durch engmaschige digitale Erfolgs- und Ablaufkontrolle optimierbar sind, in denen die Tätigkeit des Menschen in allen Details erfaßbar und berechenbar wird, automatisch zur Billiglohnarbeit.
Zunehmend trifft das auch auf geistige Tätigkeiten zu, die bisher davor eher verschont schienen. Die Analysierbarkeit beruht hier auf Mechanismen, die man auf den ersten Blick fast als »Verstehen der menschlichen Sprache durch den Computer« bezeichnen möchte. In Wahrheit stecken dahinter jedoch auch nur komplexe Algorithmen, die mit ausführlichen Daten über die Struktur der Sprache, ihre Gesetzmäßigkeiten, typische Abfolgen von Worten im Kontext anderer Worte und semantische Zusammenhänge gefüttert werden. Es wird hier also kein »Verständnis« im Sinne einer Intelligenzleistung erbracht, es wird aber eine immer vollständigere Abbildung der Struktur von Sprache erreicht, aus der sich Worte, Wortgruppen und Satzteile und ihre Zusammenhänge algorithmisch extrahieren lassen. Ein sprachlicher Fingerabdruck jedes Mitarbeiters kann beispielsweise so erstellt werden.
Die Basis der maschinellen »Schlauheit«
Der Fortschritt von Computerleistung und Speicherkapazität bedeutet, daß immer komplexere Rechenregeln auf immer größere Mengen Daten angewandt werden können. Das Geheimnis des Erfolges der algorithmischen Orakel ist also das Zusammentreffen von drastisch verbilligtem Speicherplatz und Computerkapazitäten mit der Verfügbarkeit von immer mehr digital erfaßten Lebensäußerungen. Seit kurzem erst funktionieren die von den Anhängern des »machine learning« entwickelten Methoden in der Praxis. Jahrzehntelang fristete dieser oft belächelte Teil der Forschung an »Künstlicher Intelligenz« ein Schattendasein innerhalb der Informatik.
Mit Hilfe dieser »machine learning«-Methoden kann zum Beispiel die Arbeit eines Mitarbeiters im Marketing im Detail automatisch analysiert werden. Stammen die von ihm eingebrachten Texte von ihm, oder hat er sie nur irgendwoher kopiert und ein wenig verändert? Wie groß ist sein Wortschatz, wie viele Schreibfehler macht er? Selbst Kreativität läßt sich so bis zu einem gewissen Grad messen, anhand von ungewöhnlichen Wortfolgen und der Sortierung der in seinen Texten vorkommenden Substantive, Adjektive und Verben zu inhaltlich verwandten Haufen, auch Cluster genannt. Der inhaltliche Zusammenhang von Texten läßt sich durch solche Stichwort-Cluster mathematisch erfassen. Der Abstand häufig vorkommender Worte zueinander und die Art ihrer Verbindung in Kombination mit der von Hand vorgenommenen Klassifizierung von inhaltlich wichtigen Worten bildet eine Art semantischen Fingerabdruck eines Textes.
Unternehmen, die solche algorithmischen Analysen anbieten und Methoden selbst entwickeln, lassen selten genaue Einblicke in ihre Arbeitsweisen zu. Dennoch lassen sich aus den Ergebnissen, die von den Maschinen ausgespuckt werden, Rückschlüsse ziehen. Das gilt für Google wie für Amazon, eBay oder iTunes, aber auch für Partnervermittlungen im Netz.
Die Methoden zur maschinellen Sprachverarbeitung haben in den letzten Jahren gewaltige Fortschritte gemacht. Dabei spielte nicht zuletzt die »lernende« Erkennung gesprochener Sprache eine große Rolle. Hier wurden die Algorithmen, die aus dem Verhalten des Menschen lernen – etwa wie er ein falsch erkanntes gesprochenes Wort korrigiert –, verfeinert und verbessert. Nachdem nun praktisch die gesamte textuelle Produktion der Menschheit in digitaler Form erfolgt und zum großen Teil im Netz in der einen oder anderen Form verfügbar ist, gibt es für die lernenden Algorithmen endlich auch genug Datenfutter, um die nächste Stufe der Perfektionierung zu erreichen.
»Machine Learning« verfolgt den Ansatz, etwas der Intelligenz Vergleichbares durch die Sammlung und Analyse von
Weitere Kostenlose Bücher