Achtung Denkfalle! - die erstaunlichsten Alltagsirrtümer und wie man sie durchschaut
als Opfer und für Weiße als Opfer separat betrachtet, ist in beiden Opfergruppen der Anteil verhängter Todesurteile bei schwarzen Angeklagten größer (22,9 % gegenüber 11,3 % bei weißen Opfern (siehe Teil I der Tabelle) und 2,8 % gegenüber 0,0 % bei schwarzen Opfern (siehe Teil II der Tabelle)). Zweites Ergo: Ganz gleich, welche Hautfarbe das Opfer hatte, farbige Angeklagte werden häufiger zum Tode verurteilt als weiße Angeklagte. Pech für uns: Die beiden Schlussfolgerungen widersprechen sich. Zwar hören sich beide plausibel an, doch nur eine kann richtig sein. Aber mittlerweile sind wir an Derartiges gewöhnt.
Das Paradoxon der einander widersprechenden Schlussfolgerungen entsteht dadurch, dass ein Todesurteil häufiger verhängt wurde, wenn das Opfer weiß als wenn es farbig war. Und: Weiße bringen weitaus häufiger Weiße um, als sie Schwarze umbringen. Die grobkörnige Analyse der Daten ohne Berücksichtigung der Hautfarbe des Opfers, als der im Hintergrund aber stark wirkenden Variable, führt zu einer Verfälschung der Ergebnisse: Das erste Ergo trifft nicht den Kern der Sache. Das zweite Ergo trifft zu.
Man spricht hier von Konfundierung. Das Ignorieren des wichtigen Wirkfaktors
Hautfarbe des Opfers
führt zu einer Fehldeutung. Die Präsenz von konfundierenden Variablen kann generell die Gültigkeit einer Schlussfolgerung stark beeinflussen und unter Umständen, wenn diese Variablen unberücksichtigt bleiben, die Daten also über sie hinweg vereinigt sind, sogar ins Gegenteil verkehren.
Jäger gegen Jäger
Die Parabel von den zwei Jägern, die von einem Bär verfolgt werden. Der erste meint: «Es ist hoffnungslos. Der Bär kann doppelt so schnell laufen wie wir.» Der zweite: «Es ist nicht hoffnungslos. Ich muss nicht schneller laufen als der Bär. Ich muss nur schneller laufen als du.»
Das Simpson’sche Aggregierungs-Paradoxon kann immer dann eintreten, wenn Daten von Gruppen ungleicher Größe vereinigt werden und eine konfundierende Variable präsent ist, welche einerseits die abhängige Variable beeinflusst, der unser Hauptaugenmerk gilt (z.B. Todesstrafenanteile), und andererseits auch auf die unabhängige Variable (z.B. Hautfarbe des Täters) einwirkt. Sprachlich bedeutet
konfundieren
so viel wie vermengen, vermischen oder durcheinanderbringen. Datenanalytisch liegt Konfundierung immer dann vor, wenn die zu untersuchende Variable von zwei oder mehr Faktoren gleichzeitig beeinflusst wird. Zusätzlich zu dem in die Analyse einbezogenen Faktor gibt es also noch mindestens einen anderen sogenannten Störfaktor. Konfundierung durch im Hintergrund aktive Effekte ist oftmals der Grund für Fehldeutungen von Ursache-Wirkungs-Beziehungen. Nicht in Betracht gezogene Störfaktoren machen empirische Befunde mitunter vollständig uninterpretierbar. Konfundierungseffekte lassen sich aber durch das Kontrollieren von Störfaktoren abfangen oder zumindest in Grenzen halten. Eine Möglichkeit der Kontrolle besteht darin, die Daten für verschiedene Werte des Störfaktors aufzuschlüsseln und diese separat zu interpretieren.
Konfundierung im Alltag
Ein Vater und seine kleinen Kinder fahren in der S-Bahn. Die Kinder sind außer Rand und Band, der Vater hat seine Hände vors Gesicht genommen und tut gar nichts. Die Mitreisenden werden unruhig, und schließlich fordert einer den Vater auf, seine Kinder besser zu kontrollieren, mit dem impliziten Vorwurf, er vernachlässige seine Erziehungspflichten. Der Vater sagt, dass sie gerade aus dem Krankenhaus kämen, wo seine Frau, die Mutter der Kinder, heute verstorben sei. Diese Hintergrundinformation ändert die Einschätzung der Mitreisenden grundlegend.
Die Beispiele öffnen uns die Augen dafür, dass es möglich ist, eine Gesamtmenge so in Teilmengen zu zerlegen, dass eine Eigenschaft der Gesamtmenge (etwa eine Größer-Kleiner-Beziehung) in Widerspruch steht zu derselben Eigenschaft in allen Teilmengen der Zerlegung. Konkret gesagt: Werden zwei Tabellen zu einer einzigen Tabelle verschmolzen, können sich Eigenschaften ändern. Auf diese Weise lassen sich bisweilen Tatsachen verfälschen.
Erwägung und Empfehlung.
Das Simpson’sche Paradoxon ist ein Teil der Statistikausbildung in der Mathematik. Jeder Statistiker ist sensibilisiert für die Probleme, die entstehen können, wenn Daten zusammengefasst und aggregiert werden, denn es ist eine ganz einfache und weitverbreitete Möglichkeit, mit Daten Schindluder zu treiben, mit an sich korrekten
Weitere Kostenlose Bücher