Abschied von der Küchenpsychologie
Waage, die für ein Paket auch bei hundert Wägungen immer dasselbe Gewicht anzeigt – so zuverlässig können psychologische Messungen natürlich nie sein. Man kann z.B. nicht völlig ausschalten, dass Aufgaben durch Raten gelöst werden oder dass Antworten durch ein Missverständnis zustande kommen.
Aber durch sorgfältige Testkonstruktion versucht man, solche Einflüsse zu minimieren. Aufschluss über die tatsächlich erreichte Mess-Verlässlichkeit erhält man unter anderem, indem man bei denselben Personen den Test zu verschiedenen Zeitpunkten wiederholt oder indem man zwei Versionen des Tests entwirft und schaut, wie gut die Ergebnisse übereinstimmen. Das Ergebnis der Erprobungen wird in Form von Kennwerten mitgeteilt.
In Vesters Lerntypentest wird das Problem unzuverlässiger Messungen völlig übersehen, wie die grotesk naive Aussage zeigt: «Jede Abweichung in eine Richtung bedeutet eine Bevorzugung des betreffenden Eingangskanals.» Denn kleine Abweichungen können eben reiner Zufall sein, und wie groß deshalb die Unterschiede zwischen den vier Kanälen sein müssen, um eine persontypische «Bevorzugung» herauslesen zu können, das bleibt völlig unklar. Jedenfalls würde kein seriöser Diagnostiker etwa nach einem Intelligenztest sagen: Sie haben beim Wortverständnis 80 Prozent gelöst und beim Rechnen 78 Prozent, also liegt Ihre Begabung eher im Sprachlichen.
Nun zum dritten Gütekriterium:
Sagt der Test etwas über den Sachverhalt aus, den er erfassen will?
Es kommt ja nicht nur darauf an, dass ein Test überhaupt verlässlich misst, sondern eben genau
das
, was er messen
soll
. Im Fachterminus geht es hier um die
Validität
oder
Gültigkeit
. Wie gut kann man beispielsweise mit einer bestimmten Art des Bewerbungsgesprächs die berufliche Eignung von Bewerbern erfassen? Oder: Wie weit misst eine Mathearbeit unter scharfem Zeitdruck wirklich die mathematische Kompetenz und wie weit vielleicht, unbeabsichtigt, die Stressfestigkeit?
In psychologischen Tests wird die Validität auf sehr unterschiedliche Weise geprüft – je nach Testzweck. Bei einem Eignungstest würde man untersuchen, wie erfolgreich die getesteten Personen später tatsächlich sind (z.B. im Studium oder im Beruf), bei einem Ängstlichkeitsfragebogen würde man unter anderem ermitteln, wie gut die Testergebnisse mit anderen Indikatoren für Ängstlichkeit zusammenpassen, und manche Tests sind «in sich» valide, weil eindeutig ist, was sie prüfen, z.B. die Leistung in der Rechtschreibung oder in den Grundrechenarten – es sei denn, die Rechenaufgaben sind in Texte gekleidet, sodass auch die Sprachkompetenz eine Rolle spielt. Bei einigen Tests ist ihre Validität wissenschaftlich umstritten, und manche diagnostischen Instrumente sind mangels Validität auch ganz auf der Strecke geblieben, so etwa die Graphologie.
Im Beispiel des Lerntypentests wird einfach vorausgesetzt, dass er Aussagen über eine persontypische Lerndisposition erlaubt. Überprüft wurde nichts. Zum Beispiel: Behält jemand, der vorgelesene Gegenstandswörter am besten behalten hat (= Eingangskanal Hören), ebenfalls abstrakte Wörter (Philosophie, Gerechtigkeit, Zukunft …) besser, wenn er sie hört, als wenn er sie liest? (Sehen und Anfassen sind hier ohnehin ausgeschlossen.) Und vor allem: Zeigt sich die ermittelte «Bevorzugung» eines Eingangskanals außer bei zusammenhanglosen Wortreihen auch beim Lernen aus Vorträgen, verglichen mit dem Lernen aus Texten? Jedenfalls ist das Auswendiglernen von Gegenstandswörtern bzw. von gesehenen oder betasteten Gegenständen doch wohl nicht gerade typisch für das Studium von Physik, Geschichte oder anderen Fächern! (Mehr zum Thema Lerntypen und Lerntypentests in Kapitel 11.1 , S. 269 ff.)
Wie erwähnt, ist es bei seriösen Tests üblich, in einem Begleitbuch und/oder Fachzeitschriften mitzuteilen, auf welche Weise die genannten Qualitäten geprüft und welche Ergebnisse dabei ermittelt wurden. Diese Angaben betreffen den fertigen Test. Doch schon vorher in der Entwicklungsphase müssen die Testkonstrukteure geeignete
Aufgaben
oder
Fragen
zusammenstellen. Auch dies geschieht nicht in freier Intuition, sondern in einem langwierigen Auswahlprozess. Dabei wird jede einzelne Frage oder Aufgabe geprüft. So muss man bei Leistungs- und Fähigkeitstests den Schwierigkeitsgrad jeder Aufgabe kennen (wie viel Prozent der Personen lösen das korrekt?) und sie gegebenenfalls im Test nach Schwierigkeit staffeln. Auch
Weitere Kostenlose Bücher