Deze nieuwsbrief is ook te downloaden als Word document: klik.

Nieuwsbrief # 9

===================================================================
25 februari 2005

redactie: Peter Tellegen

Heymans Instituut
Rijksuniversiteit Groningen

===================================================================

Geachte lezer,

In deze nieuwsbrief weer veel aandacht voor de ontwikkelingen rond intelligentietests. Dit jaar wordt het honderdjarig bestaan gevierd van de intelligentietest, maar dit paradepaardje van de psychologie heeft inmiddels veel van zijn glans verloren. Over de zin van een testafname en over de betekenis van de uitkomst hoeft vaak niet meer te worden nagedacht. Het gebruik van een test wordt voorgeschreven en de consequenties van de uitkomst kunnen in een tabel worden afgelezen. Dat de getalsmatige onderbouwing van deze tests nogal eens gebreken vertoont, doet daarbij nauwelijks meer terzake. Mits de test maar "door de COTAN komt" staat niets het gebruik in de weg.
In de vorige eeuw werd de (intelligentie)test wel gezien als het bewijs dat psychologie een echte wetenschap is. Het gerommel met tests maakt duidelijk dat dit niet zo vanzelfsprekend is.

===================================================================

De WISC-III NL

De afgelopen maanden is met dr. Larry Weiss gecorrespondeerd over de tekortkomingen van de normering van de WISC-III NL. Larry Weiss is als psychometricus van Harcourt verantwoordelijk voor de ontwikkeling van de Wechsler-tests.

Aanpassing normering MBO-leerlingen
Naar aanleiding van de correspondentie is besloten om bij de 16-jarigen (opnieuw) leerlingen van het MBO in de normgroep op te nemen. In januari van dit jaar heeft Paul McKeown van Harcourt Europe aan de gebruikers meegedeeld dat de normering toch weer zou worden aangepast aangezien aan het licht was gekomen dat de steekproef niet geheel conform de CBS-gegevens was. Nu was deze informatie weliswaar al enkele jaren bekend maar helaas werd dit tot nu toe door de auteurs genegeerd. De publicatie van de nieuwe handleiding is uitgesteld tot april. Dit betekent dat een beoordeling door de COTAN later zal plaatsvinden dan eerst de bedoeling was.

Als een gerustelling wordt in de brief van Harcourt meegedeeld dat de wijziging van de steekproef een minimale of zelfs een niet-significant effect zal hebben op de normering. Ook bij de presentatie van de eerste herziening van de normering in 2003 werd met een zekere voldoening gemeld dat de verschillen niet meer dan 1 of 2 IQ-punten zouden bedragen. Dit is echter een reden tot zorg want een goede normering van de WISC-III zal noodzakelijkerwijs vrij aanzienlijke veranderingen in normen gaan inhouden. Dat de scores nauwelijks veranderen betekent in feite dat deze tweede herziening opnieuw niet adequaat is en dat straks zal blijken dat een derde herziening van de normen noodzakelijk is. Tenminste, indien tegen die tijd nog iemand is geïnteresseerd in de WISC-III.

Er wordt nu één aspect van de gebreken aangepakt maar er wordt bij het voortgezet onderwijs niets gedaan aan het ontbreken van leerlingen van het speciaal onderwijs en aan het ontbreken van zittenblijvers in de Belgische normgroep.

WISC-III ongeschikt voor leerlingen speciaal onderwijs
Naar aanleiding van de kritiek dat bij de oudere leeftijdsgroepen de leerlingen van het speciaal onderwijs waren weggelaten, liet Larry Weiss weten dat hij van de auteurs had begrepen dat leerlingen van het speciaal onderwijs wel waren getest maar dat zij waren weggelaten uit de normgroep omdat door gedragsproblemen hun scores niet valide zijn. Dit is zeer opmerkelijk.
Naar de mening van de auteurs van de Nederlandse bewerking van de WISC-III is deze test blijkbaar niet geschikt om te worden afgenomen bij leerlingen van het speciaal onderwijs. Dit had men toch wel wat duidelijker en eerder naar buiten mogen brengen. Larry Weiss was ook geïnformeerd dat in Nederland om deze reden veelal leerlingen van het speciaal onderwijs niet in de normering van een intelligentietest worden opgenomen. Maar ook hier klopt de informatie niet.
De WISC-R, de SON-R 5,5-17, de NIO en NDT zijn allemaal voorbeelden van intelligentietests waarbij leerlingen van het speciaal onderwijs (zowel op toenmalig LOM- als MLK-niveau) wel in de normgroep zijn opgenomen. Bij de RAKIT was dit niet het geval. Dit was echter niet omdat leerlingen van het speciaal onderwijs met de RAKIT moeilijk testbaar zouden zijn (in 1993 was de conclusie van Resing en Bleichrodt naar aanleiding van hun onderzoek met de RAKIT: De test blijkt een betrouwbaar instrument om de intelligentie van kinderen in het speciaal onderwijs te kunnen meten) maar omdat de resultaten van het speciaal onderwijs pas veel later beschikbaar kwamen.

Er doet zich dus de eigenaardige situatie voor dat uitgever/auteurs gaan beweren dat de WISC-III niet geschikt is voor leerlingen van het speciaal onderwijs; ondertussen wel wetend dat dit onzin is; maar dat zij dit toch volhouden omdat zij anders deze groep weer op zouden moeten nemen in de normering. Dat zou dan betekenen dat de normen worden verbeterd en dat de normen ook gaan veranderen, iets wat vermeden lijkt te moeten worden. Het handhaven van foute normen en dientengevolge onjuiste beoordelingen van kinderen wordt blijkbaar geprefereerd boven het erkennen van de gemaakte fouten.

Twee-maandelijkse intervallen voor de normering
Naar aanleiding van de analyses van Testresearch waaruit bleek dat de vier-maandelijkse normgroepen van de WISC-III bij de lagere leeftijden tot grote systematische fouten leiden bij de beoordeling van kinderen die dicht rond de overgang van een leeftijdsinterval worden getest, had het NIP-Dienstencentrum besloten met twee-maandelijkse normtabellen te gaan werken. Later werd dit standpunt echter na overleg met Harcourt herroepen. Deze verbetering zou maar de suggestie van schijnnauwkeurigheid geven. Een merkwaardige typering voor een verbetering die in sommige gevallen aanzienlijk is.
Naar aanleiding van de gevoerde correspondentie laat Larry Weiss nu weten dat Harcourt de waarde van het voorstel inziet en dat men overweegt om bij de nieuwe uitgaven van de Wechsler-tests met nauwere leeftijdsgroepen te gaan werken. Dit zou een belangrijk en positief resultaat zijn. Het is echter jammer dat men niet van plan is dit toe te passen bij de huidige uitgave van de WISC-III NL. Het argument dat dit ook niet gebeurt in andere landen waar de WISC-III wordt gebruikt, en dat dit daar niet wordt bekritiseerd, overtuigt niet. Het verbeteren van de testuitkomst zou toch het primaire doel moeten zijn en is eerder reden om ook in de andere landen waar de WISC-III wordt toegepast nu al extra normtabellen ter beschikking te stellen. Iets wat vrij eenvoudig kan worden gerealiseerd.


De opheffing van het NDC

Vorig jaar zijn de testactiviteiten van het NDC (NIP-Dienstencentrum) die betrekking hadden op de ontwikkeling van de WISC-III, de DAT en van de DST, overgedragen aan Harcourt, de oorspronkelijke uitgever van deze tests. Inmiddels is besloten het NDC geheel op te heffen. Sommige activiteiten zoals cursussen zullen elders binnen het NIP worden voortgezet. De medewerkers van het NDC waarvoor geen functie meer is worden ontslagen. Hiermee lijkt een einde te zijn gekomen aan een voor het NIP ontluisterende episode.

De financiële gevolgen van het gevoerde beleid zouden echter nog lang kunnen nawerken. De afgelopen periode zijn ongeveer 200 WISC-III sets door ontevreden gebruikers geretourneerd. Nu duidelijk begint te worden dat van een daadwerkelijke verbetering van de test geen sprake zal zijn, zou het terugzenden van de test massale vormen kunnen aannemen, een schadepost van enkele miljoenen euro's. Nu kan het NIP wel zeggen dat Harcourt verantwoordelijk is voor de uitgave van de WISC-III, maar de Nederlandse bewerking is ontwikkeld onder verantwoordelijkheid van het NIP en aan de uitgever is misleidende informatie verstrekt omtrent de kwaliteit van het uitgevoerde onderzoek.

Het zou ook goed zijn als er een discussie werd gevoerd over wat er bij het NDC is misgegaan. De conclusie dat een commerciële activiteit als testontwikkeling niet binnen het NIP blijkt te passen, is misschien te gemakkelijk. Het NDC had ook een financieel succes geweest kunnen zijn en een centrum voor zorgvuldige en vernieuwende testontwikkeling. Uit de beschrijving van het onstaan van het NDC in het artikel "Opkomst en Ondergang van het NDC (NIP-Dienstencentrum)" blijkt echter dat de twee leden van het toenmalig hoofdbestuur van NIP die in het NDC de belangrijkste functies kregen, niet de benodigde capaciteiten hadden. Hiermee was de basis gelegd voor de mislukking van het NDC.


De nieuwe normen van de WAIS-III NL

Begin dit jaar heeft Harcourt de verbeterde normen van de WAIS-III gepubliceerd. Voor deze test waren nieuwe normen noodzakelijk omdat de normen die ongeveer vijf jaar geleden waren gepubliceerd sterk waren vertekend door een niet-representatief samengestelde normgroep (zie het artikel "De kwaliteit van de normen van de WAIS-III").
Uit de presentatie door Harcourt van de verschillen tussen de oude en de nieuwe normscores blijkt dat de nieuwe IQ-scores gemiddeld 1.8 punten hoger zijn met een standaarddeviatie van 3.2 punten. Dit betekent dat de oude scores in ongeveer 20% van de gevallen 5 of meer IQ-punten te laag zijn; bij 1% van de geteste personen zal het verschil 10 punten of meer bedragen. Aangezien de afgelopen jaren vele duizenden personen met de WAIS-III zullen zijn getest, gaat het absoluut gezien om redelijk grote aantallen waarbij het gerapporteerde IQ veel te laag was.
Ook bij minder ernstige fouten in de berekening kunnen de afwijkingen belangrijke ongewenste gevolgen hebben gehad, aangezien bij de beoordeling van de testuitkomst vaak absolute grenzen worden gehanteerd.
De fouten zijn overigens niet gelijk verdeeld. Zij komen vooral voor bij de jongste leeftijdsgroep (16-19 jaar) en bij de oudste leeftijdsgroep (75-84 jaar). In deze leeftijdsgroepen is het gemiddelde verschil ongeveer 4 punten met een standaarddeviatie van 3 punten. De fouten komen bovendien veel vaker voor, en zijn gemiddeld ook veel groter, bij personen die relatief laag op de WAIS-III NL hebben gescoord. Voor de IQ's onder de 90 is het gemiddelde verschil 4.5 IQ-punt met een standaarddeviatie van 3.0. In ongeveer 5% van de gevallen waarbij in het verleden met de onjuiste normen lage IQ-scores zijn geconstateerd, blijkt dat de score 10 punten of meer hoger had moeten zijn.

Het is vanzelfsprekend dat personen die psychologisch zijn getest, op de hoogte worden gesteld als blijkt dat hun IQ-score niet correct is berekend. Ook degenen aan wie indertijd is gerapporteerd zullen, indien de cliënt dit wenst, op de hoogte moeten worden gebracht en dossiers zullen moeten worden aangepast. Als blijkt dat de fouten negatieve gevolgen hebben gehad voor de cliënt dan wel voor de opdrachtgever, zal nagegaan moeten worden hoe de schade kan worden vergoed. Hiermee is de lastige situatie ontstaan die eerder is beschreven in het artikel "Afname van de WAIS-III of de WISC-III. Verantwoord en verstandig?"

Iedereen die de WAIS-III de afgelopen jaren heeft afgenomen zou de verantwoordelijkheid moeten nemen om zijn of haar cliënten te informeren indien de verbeterde normering tot andere uitkomsten leidt (dit kan, hoewel minder vaak voorkomend, ook een lagere score zijn). Een andere mogelijkheid is dat de uitgever middels advertenties in de dagbladen melding maakt van de gebreken in de oorspronkelijke normering en degenen die zijn getest de mogelijkheid biedt van een herberekening. Het lijkt er echter op dat de animo voor beide opties niet erg groot zal zijn. Toch zou het verzwijgen van fouten die mogelijkerwijs voor de geteste persoon nadelige, en soms zeer ernstige nadelige consequenties kunnen hebben gehad, in feite betekenen dat men zich aan bedrog schuldig maakt. Deze vorm van bedrog is echter zo duidelijk en zo goed in ieder individueel geval aantoonbaar dat deze altijd aan het licht kan komen. Zowel de psychologen als de uitgever lopen dan ook grote risico's als zij zich onttrekken aan hun plicht om de cliënten goed te informeren.

Onlangs werd in de tweede kamer gesproken om in sommige gevallen middels de prikpil af te dwingen dat zwakbegaafden geen kinderen kunnen krijgen. In een advies van de Gezondheidsraad werd enkele jaren geleden gesuggereerd om hierbij de grens te leggen bij een IQ van 60. De gang van zaken met de WAIS-III maakt duidelijk dat er onaanvaardbare risico's aan verbonden zijn als ingrijpende maatregelen zonder meer op testscores worden gebaseerd.


Het testen van kinderen met dyslexie

Specifieke handicaps kunnen ertoe leiden dat de uitkomst op een intelligentietest een vertekend beeld geeft. In een kort artikel van Véronique Prins van de stichting Actie voor Dyslexie wordt erop gewezen dat (niet onderkende) dyslexie al op jonge leeftijd ertoe kan leiden dat de cognitieve ontwikkelingsmogelijkheden van een kind worden onderschat en dat deze kinderen dan ten onrechte kunnen worden doorverwezen naar het speciaal basisonderwijs (zie: "Capaciteiten van kinderen met dyslexie worden onderschat").

In Rotterdam wordt van 5 t/m 10 maart een informatieweek gehouden over dyslexie, dyscalculie, adhd, add en andere zaken die de aandacht vragen. De week wordt georganiseerd door het Zwaan-Project. Voor meer informatie zie: www.stichting-voorelkaar.nl.


NDT-2004

De NDT (Nederlandse Differentiatie Testserie) heeft een nieuwe normering voor groep 8 van het basisonderwijs en klas 1 en 2 van het voortgezet onderwijs. Er worden verschuivende normen toegepast zodat de test gedurende het gehele schooljaar kan worden afgenomen. De COTAN heeft deze nieuwe normering als 'voldoende' beoordeeld. Ongetwijfeld is het werken met verschuivende normen een belangrijke verbetering. In de handleiding van de NDT-2004 ontbreekt echter vrijwel alle informatie die nodig is om de kwaliteit van de normering te kunnen beoordelen. Het is daarom niet duidelijk hoe de COTAN tot haar oordeel heeft kunnen komen.

In de praktijk wordt geconstateerd dat de uitkomsten op de NDT weinig valide lijken. Dit is voor de RVC-VO reden geweest om de NDT dit jaar voor het laatst toe te staan. Door de nieuwe normering zijn deze problemen niet opgelost. Uit de handleiding van de NDT blijkt ook dat de NDT-scores van leerlingen die bij het RVC-VO worden aangemeld een opvallend grote spreiding in scores hebben, hetgeen sterk afwijkt van andere tests en wat moeilijk valt te verklaren.

Afgezien van de normering is er het probleem dat de NDT door de selectie en weging van subtestscores die gebruikt worden voor de berekening van het IQ, een IQ-score heeft die vrijwel geheel wordt bepaald door de verbale onderdelen. De twee verbale onderdelen krijgen een gemiddeld gewicht van .40. De drie andere onderdelen hebben een gemiddeld gewicht van .175. Dit betekent dat deze test die juist bedoeld is voor het VMBO, met relatief veel allochtone leerlingen, óf niet bruikbaar is voor een belangrijk deel van de schoolpopulatie, óf wel gebruikt gaat worden bij leerlingen met anderstalige achtergrond en dan bijdraagt aan de achterstelling van allochtone kinderen.

Bij de NIO en soortgelijke tests doen dergelijke problemen zich ook voor maar in mindere mate omdat de taalcomponent minder domineert. Bij de NIO wordt dit probleem bovendien onderkend en wordt middels de onderzoeksresultaten de mogelijkheid geboden hiervoor te corrigeren. Bij de NDT wordt het probleem tot nu toe echter niet erkend. In discussies wordt naar voren gebracht dat de test geschikt zou zijn voor allochtonen omdat er geen sprake is van item-bias. De conclusie dat de NDT geschikt is voor allochtonen kan uit dergelijke analyses niet getrokken worden aangezien het probleem zich voordoet op (sub)test niveau.
Uit het onderzoek met de NIO blijkt dat verbale intelligentietests niet alleen de intelligentie van allochtone leerlingen onderschatten, maar dat ook het onderwijsniveau dat deze leerlingen aankunnen wordt onderschat.
Nu testscores de onderwijskeuze steeds meer gaan determineren, bestaat het risico dat het opleidingsniveau van allochtone kinderen als gevolg van onjuist testgebruik de komende jaren verder achterop raakt. Soms wordt naar voren gebracht dat het juist rechtvaardig is om allochtone en autochtone kinderen op dezelfde wijze te testen. In feite echter worden deze twee groepen niet op dezelfde wijze getest maar is er sprake van discriminatie: de intelligentie van de ene groep wordt bepaald middels kennis en vaardigheid in de moedertaal terwijl bij de andere groep het oordeel wordt gebaseerd op kennis en vaardigheid met betrekking tot een later aangeleerde taal.


to top to top to top to top

homepage T&T homepage SON-tests