Psychologische Testverfahren

Psychologische Testverfahren kann zur Bewertung der Fähigkeiten, Verhaltensweisen und Persönlichkeitseigenschaften von Menschen eingesetzt werden. Die bekanntesten davon sind Intelligenztests.


Intelligenztests

Wann spricht man von einem intelligenten Verhalten? Wie ist Intelligenz definiert? Wenn man Laien dazu befragt, bekommt man einige unterschiedliche Antworten über das Alltagsverständnis von Intelligenz. Außerdem gibt es mittlerweile sehr viele pseudo-wissenschaftliche Ansichten und Bücher insbesondere zum Thema „Emotionale Intelligenz“. Diese sind zwar populär, die meisten sind aber Unsinn aus empirisch-wissenschaftlicher Sicht. Kein anderes psychologisches Konstrukt ist so sehr empirisch beforscht worden wie das der Intelligenz.

 

„Intelligenz ist eine sehr allgemeine geistige Fähigkeit, die unter anderem die Fähigkeiten zum schlussfolgernden Denken, zum Planen, zum Problemlösen, zum abstrakten Denken, zum Verstehen komplexer Ideen, zum raschen Auffassen und zum Lernen aus Erfahrung einschließt“. So lautet die wissenschaftliche Mehrheitsmeinung über Intelligenz (mainstream science on intelligence), veröffentlicht von Linda Gottfredson.

 

Was unter Intelligenz verstanden wird, ist in gewisser Weise durch den gesellschaftlichen Kontext und die Kultur beeinflusst. In den heutigen westlichen Informations- und Wissensgesellschaften entscheidet zu großen Teilen das abstrakt-logische Denkvermögen über den Erfolg in der Schule und Hochschule. Nach R. B. Cattel lassen sich zwei Arten von Intelligenz unterscheiden:

  • Es gibt Aufgaben, die relativ wenig Vorwissen voraussetzen. Das, was diese Aufgaben messen, bezeichnet er als Fluide Intelligenz. Dazu gehören zum Beispiel die Verarbeitungsgeschwindigkeit und das Schlussfolgern.
  • Die eher bildungsabhängige Befähigung nennt er Kristalline Intelligenz. Damit sind zum Beispiel das Wissen, der Wortschatz und die gesammelten Erfahrungen zu Problemlösungen gemeint.

Charles Spearman kam in seinen Forschung zu der Erkenntnis, dass es eine Korrelation gibt zwischen den einzelnen Fähigkeitsbereichen von ein und derselben Person. Er nahm deshalb an, dass es einen allgemeinen Intelligenzfaktor geben müsse, einen "General Factor of Intelligence", abgekürzt mit "g".


Wann ist ein Intelligenztest sinnvoll?

Intelligenztests gehören zu den besten diagnostischen Instrumenten, welche die Psychologie insgesamt bis heute entwickelt hat. Es ist z.B. sinnvoll, einen Intelligenztest durchzuführen, wenn Schüler*innen anhaltend schlechte Schulnoten haben. Dann besteht das Ziel eines Tests darin, die Ursachen der Schulleistungsprobleme herauszufinden.

 

Das Forschungsfeld der kognitiven Epidemiologie untersucht zudem den Zusammenhang zwischen Intelligenz und Gesundheit.


WISC-V

Ich nutze für das Alter von 6 bis 16 Jahren den Test Wechsler Intelligence Scale for Children, fünfte Edition (WISC-V) (Wikipedia-Artikel). Typischerweise werden 10 Aufgaben durchgeführt. Davon werden acht Aufgaben auf einem iPad bearbeitet, zwei werden mit Bleistift und Papier (Paper-Pencil) durchgeführt. Die Ergebnisse lassen sich durch diese Indizes darstellen:

 

Sprachverständnis

Visuell-Räumliche Verarbeitung

Fluides Schlussfolgern

Arbeitsgedächtnis

Verarbeitungsgeschwindigkeit

 

Der übergeordnete Index ist der Gesamt-IQ. Hier ist ein WISC-V-Protokollbogen von Manuela Mustermann.


KABC-II

Für Kinder und junge Menschen bis zum Alter von 18 Jahren nutze ich die Kaufman Assessment Battery for Children, zweite Edition (KABC-II) (Wikipedia-Artikel). Aufgaben daraus sind zum Beispiel "Geschichten ergänzen" und "Zahlen nachsprechen". Die Ergebnisse werden auf verschiedenen Skalen dargestellt:
 

Kurzzeitgedächtnis: Diese Skala erfasst die Aufnahme und Bereithaltung von Informationen in unmittelbarer Bewusstheit und die Nutzung dieser Information innerhalb weniger Sekunden, bevor sie vergessen wird.

 

Visuelle Verarbeitung: Diese Skala erfasst die grundlegende Fähigkeit zu Wahrnehmung, Speicherung sowie Handhabung von und Denken mit visuellen Mustern.

 

Langzeitgedächtnis und -erinnerung: Diese Skala erfasst die Fähigkeit zur Speicherung von neu oder früher gelernten Informationen und deren effektiven Wiederabruf.

 

Fluides Denken: Diese Skala erfasst die Fähigkeit zur adaptiven und flexiblen Lösung neuartiger Problemstellungen durch induktives und deduktives Denken.

 

Kristalline Fähigkeit: Diese Skala erfasst das Ausmaß spezifischen Wissens, welches ein Mensch innerhalb einer Kultur erworben hat, und die Fähigkeit, dieses Wissen effektiv anzuwenden.

 

Fluid-Kristallin-Index (FKI): Dieser Index stellt das zusammenfassende Maß für die intellektuellen Verarbeitungsprozesse dar.

 

Die KABC-II bietet Testanwendern die Möglichkeit, zwischen zwei Intelligenzmodellen zu wählen. Das Cattell-Horn-Carroll-Modell (CHC-Modell) sollte grundsätzlich das Modell der Wahl sein. Dann kann der Fluid-Kristallin-Index (FKI) gebildet werden, bei dem auch Wissen bzw. kristalline Fähigkeiten gemessen werden. Kaufmann und Kaufmann argumentieren, dass Wissen ein wichtiger Aspekt kognitiver Funktionen im realen Leben ist. In manchen Fällen kann aber ein anderes Intelligenzmodell hilfreich sein: Die KABC-II bietet hierzu einen neuro- und kognitionspsychologischen Ansatz (Luria-Modell).

 

Eine Rezension des KABC-II findet man auf bdp-verband.de bzw. TBS-TK-Rezension


WPPSI-IV

Für Vorschulkinder ab 4 Jahren und bis zum Alter von 7 Jahren nutze ich die deutsche Ausgabe des Wechsler Preschool and Primary Scale of Intelligence, vierte Edition (WPPSI-IV).


Differenzierte Auswahl der Tests

Wenn Testverfahren beim Verdacht auf Intelligenzdefiziten (ICD-10: F7) zum Einsatz kommen, müssen sie im unteren Leistungsspektrum ausreichend differenzieren. "Das bedeutet, dass die Testverfahren genügend leichte Aufgaben für die jeweilige Altersgruppe enthalten müssen (...) So eignet sich der WISC-V weniger gut zur Störungsdiagnostik bei 8-Jährigen, sondern sehr viel besser bei 14- bis 16-Jährigen" erklärt Günther Esser (2020).


Testwerte verstehen

Die von einer Person erzielten Punkte in einem Test werden zusammengezählt und mit der Punktzahl anderer Personen desselben Alters verglichen. Zum Vergleich benutzt man Normwerte. Es wird angenommen, dass die Werte in der Vergleichsgruppe glockenförmig verteilt sind, d.h. dass viele Personen mittlere Werte und wenige Personen extreme Werte aufweisen (Normalverteilung mit einem Mittelwert M und eine Standardabweichung SD). Es gibt verschiedene Skalen, in denen sich die Normwerte ausdrücken lassen und die ineinander umgerechnet werden können.

 

IQ-Skala: Die IQ-Skala ist die bekannteste Skala. Ein IQ von 100 (Mittelwert) ist ein genau durchschnittliches Ergebnis. Als Durchschnittsbereich gilt ein IQ von 85 bis 115 (Standardabweichung 15). Durch die Normalverteilung ergeben sich diese Implikationen: Etwa zwei Drittel der Testpersonen haben einen durchschnittlichen IQ (also einen Wert zwischen 85 und 115).

 

IQ kleiner 70: Geistige Behinderung

IQ 70 bis 84: Unterdurchschnittlich

IQ 85 bis 115: Durchschnittlich

IQ 116 bis 130: Überdurchschnittlich

IQ größer 130: Hochbegabung


Andere Skalen: Man kann auch andere Skalen nutzen zur Angabe derselben Testergebnisse, z.B. den Prozentrang (PR), den T-Wert oder den Standardwert (Z-Wert). Normwert-Rechner zum Umrechnen.


Umschriebene Entwicklungsstörungen schulischer Fertigkeiten

Geht es darum, schulische Fertigkeiten zu bestimmen, also das Lesen, Rechtschreiben oder Rechnen, habe ich speziell dafür entwickelte Tests. Nicht jeder Test ist gleich gut (manche Tests messen nicht genau genug das, was man messen möchte). Deswegen ist die Auswahl der psychometrischen Testverfahren wichtig. Beispiele sind:

 

Diagnostik von Rechenstörungen (Dyskalkulie) laut Leitlinie Diagnostik und Behandlung der Rechenstörung:

Der Deutsche Mathematiktest (DEMAT) wird für einige Klassen empfohlen.

 

Diagnostik von Lese- und / oder Rechtschreibleistungen laut bisheriger Leitlinie Diagnostik bei der Lese- / Rechtschreibstörung:

Die Hamburger Schreib-Probe 1-10 (HSP 1-10) wird empfohlen. So funktioniert beispielsweise die HSP 5-10B:

  • Schüler*innen bekommen ein Heft, in das sie Wörter schreiben sollen, so gut sie es können.
  • Dazu bekommen sie auf der ersten und der zweiten Seiten des Heftes jeweils sieben Wörter vorgelesen. Die Wörter werden in gewohnter Alltagssprache vorgelesen ohne spezielle Betonung.
  • Danach werden fünf Sätze diktiert. Mitgeteilt wird, wann ein neuer Satz beginnt. Satzzeichen und Redezeichnen werden aber nicht mit diktiert.
  • Am Ende gibt es noch einen Lückensatz.
  • Zur Auswertung stehen Vergleichswerte (Normen) für alle Schulformen sowie gesondert für Hauptschulen, Realschulen und integrierte Schulformen sowie für Gymnasien zur Verfügung. Die Normen beziehen sich auf die letzten drei Monate eines Schuljahres: Ende Klasse 5, Ende Klasse 6, Ende Klasse 7, Ende Klasse 8, Ende Klasse 9, Ende Klasse 10.
  • Die Rechtschreibkompetenz wird erfasst durch diese Werte: Anzahl richtig geschriebener Wörter; Anzahl richtig geschriebener Wortbestandteile (Grapheme); Grad der Beherrschung der grundlegenden Rechtschreibstrategien (alphabetische Strategie, orthographische Strategie, morphematische Strategie, wortübergreifende Strategie); überflüssige orthographische Elemente; Oberzeichenfehler.

Qualität von Testverfahren

Tests müssen reliabel, valide und standardisiert sein. Sonst liefern sie Ergebnisse, die nicht brauchbar sind. Das ist auch der Grund, warum du nicht auf irgendeiner Website irgendeinen angeblichen IQ-Test machen solltest: Du erhältst ein Ergebnis von einem Test, der nicht reliabel ist. Dadurch kann der Test aber auch nicht valide sein. Die Qualitätsmerkmale von Testverfahren werden als Gütekriterien bezeichnet. Sie sind:

 

Reliabilität ist das Ausmaß, in dem man sich darauf verlassen kann, dass ein Test konsistente Ergebnisse liefert. Wenn man  dreimal hintereinander auf eine Waage steigt und dreimal ein anderes Gewicht bekommt, misst die Waage nicht reliabel (zuverlässig).

 

Validität ist das Ausmaß, in dem ein Test misst, was er zu messen beabsichtigt ist. Ein valider Intelligenztest misst Intelligenz und nicht die Sehfähigkeit oder die Fähigkeit zum Zeichnen.

 

Standardisierung bedeutet, dass ein Test bei allen Personen immer in der gleicher Weise und unter denselben Bedingungen angewendet wird. Der Testleiter muss sich immer gleich verhalten, die Bearbeitungszeit, die Anweisungen und die Erklärungen müssen immer dieselben sein.

 

Normen werden benötigt als Bezugsrahmen für die Bewertung von einem Testergebnis. Um herauszufinden, was ein individuelles Ergebnis besagt, muss man es mit typischen Ergebnissen oder statistischen Normen anderer vergleichen.

 

Ich benutzte keine Tests der psychodynamischen Therapieverfahren (siehe Psychoanalytische Verfahren) wie "Familie in Tieren". Diesem Test "liegt die Annahme zugrunde, dass das Testverhalten des Kindes projektiven Charakter hat. Der Begriff »Projektion« wird nicht definiert. Als Begründung für die Vorgabe, die Familienmitglieder als Tiere zeichnen zu lassen, wird auf Folkloristik und Aberglauben sowie auf dichterische Produkte wie Fabeln, Legenden, Sagen und Märchen verwiesen, die sich auf das Verhältnis des Menschen zum Tier beziehen sowie auf Entwicklungspsychologie aus der ersten Hälfte des letzten Jahrhunderts und auf tiefenpsychologische Theorien. Der diagnostische Wert der genannten Grundlagen für das Verfahren wird nicht nachvollziehbar dargelegt", laut TBS-TK Rezension.


Literatur für Patient*innen

IQ-Bibel (H. J. Eysenck)

Ist Intelligenz erblich? Eine Klarstellung (D. E. Zimmer)

Intelligenz. Große Unterschiede und ihre Folgen (E. Stern & A. Neubauer)


Fachliteratur

Handbuch Intelligenz (D. H. Rost)