Bücher online kostenlos Kostenlos Online Lesen
Schönes Chaos: Mein wundersames Leben (German Edition)

Schönes Chaos: Mein wundersames Leben (German Edition)

Titel: Schönes Chaos: Mein wundersames Leben (German Edition) Kostenlos Bücher Online Lesen
Autoren: Benoît B. Mandelbrot
Vom Netzwerk:
der Legenden, die Verleger gern erzählen.
    Geben Sie einen Namen in eine Internet-Suchmaschine ein. Einige liefern so gut wie nichts, viele bringen eine kleine Zahl von Treffern, wenige dagegen viele Millionen Treffer. Denken Sie an die geografische Ausdehnung von Inseln. Grönland und Madagaskar sind riesig, doch eine unbestimmbare Zahl von ihnen ist winzig. Was ist mit der flächenmäßigen Ungleichheit der Staaten in den USA? Oder mit den sogar noch stärker ungleichen Flächen der französischen Provinzen, ehe sie durch die Revolution zu annähernd gleich großen Departments zurechtgestutzt wurden, mit den Sowjetrepubliken in der durch Stalin arrangierten Form, oder auch mit den Teilen des gegenwärtigen Russland?
    Extreme Ungleichheit ist ein vertrautes Muster in der gesamten Natur wie in der Kultur – also in den Werken des Menschen. Solche Verteilungen nennt man lang auslaufende Verteilungskurven. Für sie ist kein Wert »typisch«, und der Kontrast zwischen kurzen und langen Ausläufern sollte in meiner Arbeit eine zentrale Rolle spielen.
    Die meisten lang auslaufenden Verteilungskurven haben bedeutsame Konsequenzen, aber die Aufsätze und Bücher, die über dieses Thema über Jahre hinweg verfasst worden sind, waren enttäuschend. Ich hatte das Glück, dass mein Einstieg mit einem äußerst untypischen Beispiel begann – der Verteilung von Worthäufigkeiten, die keine wichtigen Konsequenzen hat, aber einzigartig einfach zu handhaben ist.
    Bei meiner ersten Beschäftigung mit lang auslaufenden Kurven im Jahr 1952 waren übrigens keine Computer im Spiel. Den ersten bekam ich 1953 zu Gesicht, und 1958 habe ich erstmals selbst einen verwendet, nachdem ich zu IBM gegangen war.

Zipfs universelles Potenzgesetz für die Verteilung von Wörtern
    In geschriebenen oder gesprochenen Texten kommen manche Wörter wie »der« oder »dies« oft vor, ihre Frequenz ist gut definiert. Andere Wörter haben keine definierte Häufigkeit. Zipfs Spiel ging so: Man nimmt einen Text und zählt, wie oft jedes Wort darin vorkommt. Nun weist man jedem Wort einen Rang zu: 1 für das häufigste, 2 für das zweithäufigste Wort usw. Statistiker nutzen diese Methode selten, aber es ist nichts falsch daran. Zuletzt gibt man in Form von Graphen wieder, wie oft jedes Wort in der jeweiligen Rangstufe auftrat.
    Ein eigenartiges und schwer zu lesendes Muster entsteht. Die Kurve fällt nicht allmählich vom häufigsten zum seltensten Wort ab. Sie stürzt zunächst schwindelerregend ab, dann fällt sie langsamer, gefolgt von einem langen Schwanz, der sehr langsam flach ausläuft – wie die Flugbahn eines Skispringers, der nach dem Absprung etwas hochsteigt, fällt, landet und dann über den sanfteren Hang ausläuft. Gemäß der Definition des Rangs variiert die Häufigkeit mit dem Kehrwert des Rangs. Zipf stellte eine weit stärkere Behauptung auf: Die Häufigkeit betrage etwa ein Zehntel des Kehrwerts des Rangs. Demnach ergäbe das Produkt einer Wortfrequenz und ihres Rangs annähernd den Wert von einem Zehntel. Die Kurve fällt fast mit den Koordinatenachsen zusammen – was es beinahe unmöglich macht, sie abzulesen.
    Um solche Kurven vergleichen zu können, ist es am besten, sie lesbarer aufzutragen, indem man sowohl den Rang als auch die Häufigkeit durch ihre Logarithmen ersetzt. Dieser Begriff mag ein wenig beängstigend wirken, bezeichnet aber etwas völlig Harmloses. Der dekadische Logarithmus einer Zahl entspricht etwa ihrer Länge, wenn sie mit den normalen Ziffern von 0 bis 9 dargestellt ist. Genauer gesagt ist er höchstens um eins kleiner als die Anzahl der Dezimalstellen. So nehmen die Logarithmen der Zahlen von 100 bis 1000 von 2 auf 3 zu. Wenn wir Zipfs Behauptung nehmen, dass jede Worthäufigkeit exakt ein Zehntel des Kehrwerts ihres Rangs beträgt, dann würden auf einem doppelt logarithmischen Graphen die Daten ungefähr entlang einer Geraden mit der Steigung –1 abfallen, das heißt, für jede Zunahme um 1 auf der vertikalen Achse nimmt er auf der horizontalen Achse um 1 ab.
    Die Sprache – Englisch, Französisch, Latein oder was auch immer – spielt keine Rolle. Das gilt auch – ziemlich seltsam – für den Bildungsgrad des Autors. Dies ist ein Beispiel dafür, was Physiker bald darauf als eine allgemeine Beziehung bezeichnen sollten. Ein anderer Begriff der Physik namens Skalierung liegt den Fraktalen zugrunde. Zipf sah sich seine Listen genauer an, legte eine Kurve über die Daten und entwickelte eine Formel

Weitere Kostenlose Bücher