Verantwoord testgebruik Verantwoord testgebruik Standpunten en Verzinsels Standpunten en Verzinsels .


Dit artikel is ook te downloaden als Word document: klik.

De Psycholoog, mei 2000, 231-235
--------------------------------------------------

Verantwoord testgebruik bij allochtonen

Een reactie

Peter Tellegen

Door Evers en Te Nijenhuis is gesteld dat traditionele intelligentietests goed bruikbaar zijn voor allochtonen. In deze reactie wordt beargumenteerd dat deze conclusie niet houdbaar is en discriminerend ten opzichte van allochtonen. Onze kritiek sluit aan bij de problemen die Van den Berg en Van Leest schetsen bij het testen van allochtonen, hun aanbevelingen lijken echter minder geslaagd.
Met het ongenuanceerde standpunt van Evers en Te Nijenhuis dreigen de inspanningen van het NIP voor verantwoord testgebruik bij allochtonen teniet te worden gedaan.

Allochtonen

In het juninummer 1999 van De Psycholoog, gewijd aan Psychologie en allochtonen, zijn een aantal artikelen verschenen die relevant zijn voor het testen van allochtonen. Evers en Te Nijenhuis komen tot de conclusie dat traditionele intelligentietests voor de assessment van allochtonen goed bruikbaar zijn; Van den Berg en Van Leest wijzen op de noodzaak om bij gebruik van intelligentietests eerst de taalkennis te toetsen en Vedder wijst op de grote achterstand van veel allochtonen in de beheersing van het Nederlands.

Evers en Te Nijenhuis komen tot conclusies die belangrijke implicaties zouden kunnen hebben voor de praktijk van het testgebruik, de toekomstperspectieven van allochtonen en de beeldvorming over allochtonen. Deze conclusies zijn:

  • traditionele intelligentietests zijn niet biased tegenover allochtonen;
  • het gebruik van speciale cognitieve tests voor allochtonen is niet nodig en minder wenselijk vanwege lagere validiteit;
  • de terughoudendheid in testgebruik bij allochtonen waartoe de Testscreeningscommissie (Hofstee et al., 1990) opriep is niet meer nodig.

Op logische, methodologische en empirische gronden zijn deze conclusies aanvechtbaar terwijl in sommige gevallen ook een vertekende weergave van de werkelijkheid wordt gegeven. Zo komt de Testscreeningscommissie voor een groot aantal traditionele intelligentietests tot de conclusie dat aanpassing van instructies en/of testmateriaal wenselijk dan wel noodzakelijk is op grond van etnocentrisme. Dit criterium is door de COTAN (Evers, 1999) overgenomen voor de beoordeling van de kwaliteit van tests.

In hun artikel stellen de auteurs echter dat de commissie van mening is dat de tests mogelijk niet geschikt zijn en dat dit een empirische kwestie is. Voor de commissie was etnocentrisme echter uitsluitend een inhoudelijk criterium. Opvallend is dat Evers en Te Nijenhuis de DAT’83 (Evers & Lucassen, 1992) en de GATB (Van der Flier & Boomsma-Suerink, 1994) positief bespreken voor de assessment van allochtonen, maar de door de commissie (waar Evers toch deel van uitmaakte) genoemde beperkingen en gewenste aanpassingen voor deze tests niet noemen.
Wat in het artikel het meeste opvalt is dat bij de conclusies die getrokken worden geen rekening wordt gehouden met taal- en scholingsachterstanden van allochtonen. Menen Evers en Te Nijenhuis nu echt dat sterk verbale, en schriftelijk afgenomen tests zoals de DAT’83 en de GATB goed bruikbaar zijn bij volwassen Turken en Marokkanen die analfabeet zijn? Het gaat hier niet om een kleine minderheid maar volgens de informatie die Vedder in zijn artikel noemt, om ongeveer 40% van deze allochtone groep. Zijn deze mensen allemaal zwakzinnig of zwakbegaafd of is de uitkomst op traditionele tests in dit geval misschien toch biased?
Het probleem van testbias bij allochtonen is echter niet beperkt tot analfabeten, het doet zich ook voor bij kinderen en volwassenen die nog niet lang in Nederland wonen of die niet Nederlandstalig zijn opgegroeid. Evers en Te Nijenhuis noemen wel onderzoek waaruit dit taalprobleem blijkt, maar de betekenis ervan wordt toegedekt en in de conclusies wordt met de bevindingen geen rekening gehouden. Zo vermelden zij dat uit onderzoek blijkt dat er duidelijk effect is van verblijfsduur op testscores met een verbale component, maar geen effect op alle andere tests. Vervolgens trekken zij hier de conclusie uit dat traditionele tests goed bruikbaar zijn voor de assessment van allochtonen. Het effect van verblijfsduur op de IQ-score kan echter erg groot zijn, ook wanneer een test niet gedomineerd wordt door verbale onderdelen. Op de RAKIT (Bleichrodt et al., 1984) was de IQ-score van Turkse en Marokkaanse kinderen die langer dan 5 jaar in Nederland woonden, gemiddeld 8 punten hoger dan van kinderen die minder dan vier jaar in Nederland woonden (Resing, Bleichrodt & Drenth, 1986). In dit onderzoek was de achterstand van de totale Turks/Marokkaanse groep ten opzichte van de Nederlandse normgroep bijna twee standaarddeviaties op het onderdeel Woordbetekenis terwijl de achterstand op de andere onderdelen ongeveer één standaarddeviatie was.
Bij de bespreking van de GATB melden Evers en Te Nijenhuis dat twee subtests mogelijk allochtonen benadelen (Verbaal Gestelde Rekenproblemen en Namen Vergelijken) en dat een gebrekkige kennis van het Nederlands de score licht kan drukken. Uit het onderzoek van Te Nijenhuis bij volwassen eerste generatie Turkse en Noordafrikaanse immigranten blijkt echter dat de score van deze groep op deze onderdelen 1.34 SD lager is ten opzichte van de autochtone groep, terwijl de achterstand op vijf andere onderdelen 0.76 SD is. Een verschil van meer dan een halve standaarddeviatie kan moeilijk licht worden genoemd. Opvallend is dat Evers en Te Nijenhuis bij de subtests van de GATB die mogelijk allochtonen beoordelen, niet het onderdeel Woordenschat noemen. In het onderzoek met de GATB was de score van de immigranten op deze subtest zelfs 2.01 SD lager in vergelijking tot de autochtone groep.

Testopbouw

Evers en Te Nijenhuis bespreken twee traditionele (DAT’83 en GATB) en één speciale cognitieve test (MCT-M, Bleichrodt & Van den Berg, 1997) waarbij de samenstelling en validiteitsgegevens vergeleken worden. Het valt op dat Rekenvaardigheid van de DAT’83 en Woordenschat van de GATB als tests voor Fluid intelligence worden beschreven terwijl in eerdere publicaties van de auteurs wordt benadrukt dat het hier om mengvormen van Fluid en Crystallized intelligence gaat (Evers & Lucassen, 1992; Te Nijenhuis, 1997). De DAT’83 wordt nu voorgesteld als een evenwichtig samengestelde intelligentietest terwijl in de handleiding van de DAT de test gekenmerkt wordt als mengeling van intelligentie-aspekten, specifieke vaardigheden en schoolvorderingen. In de bespreking van de DAT schrijft de Testscreeningscommissie: “door hun aard meten de subtests Woordenlijst, Woordbeeld en Zinnen, beheersing van het Nederlands in plaats van louter verbale intelligentie; in de Handleiding is de meetpretentie – in dit verband terecht – ingeperkt.” Blijkbaar worden deze beperkingen door de auteurs nu niet meer van toepassing geacht, onduidelijk is echter op grond waarvan. De auteurs hebben zich bij de beschrijving van de samenstelling van de tests gebaseerd op Carroll (1993). Hierbij gaan ze er echter aan voorbij dat de indeling van tests alleen geldig is in een bepaalde context. De tests voor taalontwikkeling hebben bij Carroll betrekking op de ontwikkeling van de moedertaal. Per definitie zijn verbale tests gebiased voor allochtonen die niet Nederlandstalig zijn opgegroeid aangezien ze niet op de ontwikkeling van de moedertaal betrekking hebben.
De speciale capaciteitentest waarmee de DAT’83 en de GATB worden vergeleken is de MCT-M. Hierover schrijven de auteurs dat de COTAN-beoordeling minder positief is in afwachting van meer onderzoeksgegevens, dat geen informatie beschikbaar is over de constructie en de theoretische achtergrond van de test en dat niet duidelijk is waarom de factor Crystallized intelligence vrijwel in de test ontbreekt. Wanneer het doel van de auteurs is om traditionele tests te vergelijken met speciale tests, zou men zich toch beter niet kunnen beperken tot één speciale test waarvan nog zo weinig bekend is. Waarom in de vergelijking niet ook de niet-verbale SON-R tests betrokken, die zeer goed beoordeeld zijn door de COTAN, in Nederland tot de meest gebruikte kinderintelligentietests behoren, informatie geven over constructie en doelstelling en waarmee onderzoek bij allochtonen is verricht (Snijders, Tellegen & Laros, 1988; Tellegen et al., 1998).
Bij de SON-R ontbreken tests voor Crystallized intelligence geheel. Dit is het gevolg van de doelstelling om een test te maken die in materiaal en afnameprocedure niet afhankelijk is van kennis van een specifieke taal. Tests voor Crystallized intelligence zijn in het algemeen in sterke mate van taal, cultuur en schoolervaring afhankelijk. Wanneer men een intelligentietest wil maken die ook voor alle allochtonen geschikt is, dan is het aan te bevelen om te test niet alleen taalonafhankelijk te maken, maar ook onafhankelijk van taken die sterk op schoolse kennis en vaardigheden een beroep doen. Wanneer men bijvoorbeeld geen rekenonderwijs heeft gehad is het onjuist om rekenprestaties als indicatie van intelligentie te beschouwen.
Evers en Te Nijenhuis hebben gelijk als ze stellen dat bij de speciale tests het intelligentiedomein wordt ingeperkt. Dit wordt echter bewust gedaan om voor specifieke doelgroepen (in het geval van de SON naast allochtonen ook doven, slechthorenden, taal-en spraakgestoorde kinderen, autistische en moeilijk testbare kinderen) op een zuivere, niet-biased, manier intelligentie te bepalen. Voor deze kinderen zal het vrijwel altijd zinvol zijn om ook informatie te hebben over de (Nederlandse) taalvaardigheid en het cognitief niveau op andere gebieden. De prestaties hierop kunnen echter niet als intelligentieniveau geïnterpreteerd worden.

Begripsvaliditeit

De vraag naar de begripsvaliditeit van traditionele en alternatieve tests en de vraag of er sprake is van testbias – hebben de tests of onderdelen daarvan dezelfde betekenis voor autochtone en allochtone groepen – wordt door Evers en Te Nijenhuis beantwoord aan de hand van onderzoek van de factorstructuur en itembias. De overeenkomst in factorstructuur is interessant maar toont niet aan dat er van bias geen sprake is. Overeenkomstige correlaties kunnen op verschillende wijze tot stand komen. Bij diverse testonderdelen blijkt wel van itembias sprake te zijn. Aangezien deze bias van weinig invloed is op de totaalscore wordt ze door de auteurs als niet-relevant voor de selectiepraktijk beschouwd. Geringe effecten op de totaalscore zijn echter inherent aan het itembiasonderzoek dat zich richt op incidenteel afwijkende items.
Het is opmerkelijk dat in het kader van de bespreking van de begripsvaliditeit de relatief lage prestaties van allochtonen op verbale intelligentietestonderdelen niet ter sprake komen, en de samenhang hiervan met verblijfsduur. Deze effecten waarbij belangrijke onderdelen van een test in hun geheel gebiased zijn, zijn veel ingrijpender dan item-bias en kunnen voor de diagnostiek en de selectiepraktijk grote gevolgen hebben. Gemiddeld scoren Turkse en Marokkaanse kinderen op de niet-verbale SON-tests ongeveer 8 IQ-punten hoger dan vergelijkbare groepen op de RAKIT. De achterstand die ook met de SON wordt geconstateerd is bij de traditionele test aanzienlijk groter. In zijn dissertatie (Te Nijenhuis, 1997), en ook in andere publicaties (Te Nijenhuis & Van der Vlier, 1997, 1999), komt Te Nijenhuis wel met een verklaring. Allochtonen scoren niet vooral laag op verbale testonderdelen omdat zij mogelijk nauwelijks Nederlands spreken of geen scholing hebben gehad, maar omdat de verbale tests het best met algemene intelligentie samenhangen. Deze interpretatie wordt gebaseerd op correlaties rond de .75 tussen de lading op g, de algemene intelligentiefactor, en de achterstand van allochtonen in prestaties op de testonderdelen van de GATB. Voorbarig is dat hier een oorzakelijk verband wordt gelegd. De correlatie kan heel wel een artefact zijn van de beperkte samenstelling van de GATB waarbij de minder verbale onderdelen een lage lading op g hebben, en in het geval het onderdeel Strepen zetten eigenlijk helemaal niet thuishoren in een intelligentietest. Bij het eerder genoemde onderzoek met de RAKIT waarbij allochtonen zeer laag scoorden op het onderdeel Woordbetekenis, blijkt dat er geen relatie is tussen g, de lading op de eerste ongeroteerde hoofdcomponent in de autochtone normgroep, en de gemiddelde genormeerde subtestscore van de Turks/Marokkaanse kinderen. De door ons berekende correlatie is -.06. De implicatie van de interpretatie van Te Nijenhuis is dat traditionele intelligentietests het intelligentieniveau van allochtonen niet onderschatten, maar juist overschatten. Voor zover allochtonen gemiddeld redelijke prestaties behalen op bepaalde testonderdelen zou dit vooral te danken zijn aan het feit dat deze onderdelen weinig met intelligentie te maken hebben.

Predictieve validiteit

Naast de begripsvaliditeit wordt in het artikel van Evers en Te Nijenhuis aandacht geschonken aan mogelijke verschillen in predictieve validiteit van de tests met betrekking tot autochtonen en allochtonen, en aan het verschil in predictieve validiteit tussen de tests. In diverse gevallen werden bij autochtonen en allochtonen verschillen gevonden tussen de regressielijnen. Dit hoeft echter niet te betekenen dat de gebruikte tests biased zijn. Omgekeerd kan de test biased zijn terwijl de regressieformules overeenkomen, bijvoorbeeld doordat het criterium biased is. Op grond van enkele onderzoeken kan ook niet geconcludeerd worden dat ‘de’ criteriumvaliditeit van een test voor allochtonen en autochtonen (redelijk) gelijk is. Criteria voor intelligentietests zijn zo divers, evenals de mogelijke samenstelling van de onderzoeksgroepen, dat niet buiten de specifieke onderzoekssituatie gegeneraliseerd kan worden. Dergelijk onderzoek geeft informatie over bias in een specifieke selectiesituatie en niet direct over bias van de test.
De vergelijking tussen de predictieve validiteit van de DAT’83, de GATB en de MCT-M beperkt zich tot één onderzoek per test. De onderzoeksgroepen zijn verschillend (brugklasleerlingen, aspirant-chauffeurs en cursisten bij praktijkopleidingen op MBO-niveau) evenals de gebruikte criteria (rapport- en toetscijfers, chauffeursexamen en inschatting door praktijkdocenten van de kans op een baan). Verder worden voor de traditionele tests alleen correlaties met totale testscores vermeld terwijl voor de MCT-M eerst de lage, op subtestscores gebaseerde correlaties worden genoemd. De auteurs menen niettemin dat op grond van zulke gebrekkige en niet-vergelijkbare gegevens geconcludeerd kan worden dat alternatieve tests als de MCT-M een lagere predictieve waarde hebben dan traditionele tests.
Als aanvullend argument wordt door hen genoemd dat de predictieve validiteit van de totaalscore op de DAT’83 sterk vermindert wanneer de drie tests voor Crystallized intelligence worden weggelaten. Dat deze drie op schoolvorderingen gerichte tests sterk met schoolprestaties samenhangen is niet verwonderlijk. Over deze onderdelen schrijven Evers en Lucassen in de handleiding: “Woordenlijst is een subtest voor het meten van de woordenschat: de mate waarin men de betekenis van (Algemeen Beschaafde) Nederlandse woorden kent. ... Bij uitstek meet Woordenlijst iets dat men door leren moet verwerven. Vaak ziet men dat de woordenschat groot is bij diegenen die goed onderwijs hebben gehad.” “Woordbeeld meet de mate waarin de kliënt de spelling van het Nederlandse taal beheerst. Woordbeeld heeft bij uitstek het karakter van een studietoets: het gaat om vaardigheden die op school, in het basisonderwijs en in de lagere klassen van het voortgezet onderwijs, systematisch worden aangeleerd.” “Zinnen pretendeert te meten in hoeverre de kliënt kennis van en gevoel voor de bouw van Nederlandse zinnen heeft. De subtest doet daarbij voor een belangrijk deel een beroep op kennis die men op school vrij systematisch verwerft, en heeft in dat opzicht dan ook het karakter van een studietoets.” Evers en Te Nijenhuis stellen dat het weglaten van dergelijke testonderdelen uit tests die voor allochtonen bedoeld zijn, de validiteit sterk vermindert. De rationale voor de constructie en het gebruik van alternatieve tests zoals de MCT-M of de SON-R is volgens hen grotendeels verdwenen. Testbias blijkt nauwelijks voor te komen. Naar onze mening zijn bovengenoemde tests voor Crystallized intelligence echter totaal onbruikbaar als valide indicator van de intelligentie voor allochtonen die niet Nederlandstalig zijn opgegroeid en die niet op een normale wijze Nederlandstalig onderwijs hebben gehad.

Beperkingen testgebruik

Aan het verantwoord gebruik van traditionele intelligentietests bij allochtonen zijn twee problemen verbonden die onderling met elkaar samenhangen. Dit is de vraag wanneer bij allochtonen het gebruik van een een traditionele test verantwoord is, en de vraag voor welke testonderdelen het gebruik verantwoord is. Aan de ene kant staat de immigrant die niet Nederlands kan spreken of lezen en net in Nederland is gearriveerd. Weinig psychologen, Evers en Te Nijenhuis mogelijk uitgezonderd, zullen geneigd zijn bij deze persoon een traditionele intelligentietest af te nemen. Aan de andere kant staat het kind van buitenlandse ouders, in Nederland geboren, thuis Nederlandstalig opgevoed en met een normale schoolloopbaan. Er zijn eigenlijk geen redenen te bedenken waarom een traditionele test in dit geval niet geschikt zou zijn. Het probleem is nu waar de grens tussen beide ligt. We onderschrijven de aanbeveling van Van den Berg en Van Leest om bij allochtonen vooraf de taalkennis te toetsen. Dit geeft informatie of het taalniveau voldoende is om de instructies te begrijpen, een basisvoorwaarde voor afname van de test. Wanneer de onderzochte echter niet Nederlandstalig is opgegroeid, is het niet juist om tests gericht op kennis en inzicht in de Nederlandse taal, zoals de drie eerder genoemde onderdelen van de DAT’83, als intelligentietest af te nemen. Of het gebruik van verbale tests zoals verbale analogieëntests verantwoord is, hangt sterk af van het vereiste taalniveau. Als de elementen van het item niet bekend zijn, kan niet geconcludeerd worden dat de persoon niet in staat is relaties te leggen. Voor (niet-verbale) tests van Crystallized intelligence is het van belang of de persoon een normale schoolloopbaan heeft gehad die aansluit bij zijn of haar capaciteiten. Wanneer er een achterstand is, bijvoorbeeld door minder of geen onderwijs in het land van herkomst, of door een achterstand in het onderwijs in Nederland als gevolg van taalproblemen, dan kunnen aan schoolse kennis gerelateerde tests, zoals rekentests, niet een valide indicatie van intelligentie zijn.
Binnen traditionele tests is er een grote variatie in de mate waarin de subtests een beroep doen op kennis van het Nederlands. Men dient alert te zijn dat ook niet typisch verbale testonderdelen een belangrijke verbale component kunnen hebben, zoals redactiesommen, visuele waarnemingstests zoals Namen vergelijken in de GATB en geheugentests die met Nederlandse woorden werken. Daarnaast zijn de instructies bij traditionele intelligentietests in het algemeen verbaal. Dit kan betekenen dat voor het uitvoeren van niet-verbale taken toch een aanzienlijke kennis van het Nederlands is vereist. Bij de DAT'83 staan in de instructies voor niet-verbale subtests onder meer de volgende zinnen: "Zoals u ziet, draait de stip regelmatig rond in de richting van de wijzers van de klok.” “De kombinaties op het antwoordformulier vergelijkt u vervolgens met die in het testboekje, tot u de kombinatie ziet die niet in het testboekje staat.” “In het patroon komt geen lange zijkant voor die grijs is en in de figuur moet het grote vlak aan de bovenkant grijs zijn.” “Omdat het gewicht het dichtst bij hem op de plank ligt, moet mijnheer B het zwaarste tillen.” De bruikbaarheid voor allochtonen van zulke niet-verbale testonderdelen in traditionele tests zou kunnen worden verbeterd door de instructies in de moedertaal aan te bieden.

Van den Berg en Van Leest schetsen in het juninummer van De Psycholoog een duidelijk beeld van de problemen die met het testen van allochtonen verbonden kunnen zijn. Bij de door hun gesuggereerde oplossingen en adviezen willen we, voor zover het het intelligentieonderzoek betreft, wel enkele kanttekeningen plaatsen. De oplossing wordt door hen niet zozeer in aanpassing van de tests gezocht maar in aanpassing van de normgroepen. Normen die van toepassing zijn in het land van herkomst of apart te ontwikkelen normen waarbij zo mogelijk rekening wordt gehouden met de leeftijd waarop men naar Nederland is gekomen en de gevolgde basisopleiding. Afgezien van de complexiteit van de onderneming wordt a priori vastgelegd dat verschillende groepen dezelfde gemiddelde intelligentie hebben waardoor onderlinge vergelijking niet meer zinvol is. In de tweede plaats wordt binnen de nieuwe normgroepen nog niet een valide intelligentiebeoordeling bereikt. Het zal bijvoorbeeld voor de verbale onderdelen verschil blijven uitmaken of thuis Nederlands gesproken wordt. Verder kan men wel aparte normen maken voor kinderen met een onderwijsachterstand van drie jaar, maar deze achterstand kan ook het gevolg zijn van een beperkte intelligentie.
Wanneer geen tests in een voor de persoon goed begrijpelijke taal met passende normgroepen te vinden zijn, kan naar de mening van Van den Berg en Van Leest van non-verbale tests als de Test of Nonverbal Intelligence (Brown, Sherbenou & Johnsen, 1990) gebruik worden gemaakt. Vreemd dat in dit verband niet de SON-tests worden genoemd. De TONI-2 is een eenvoudige korte test die uit één onderdeel bestaat en voor diagnostiek minder geschikt is. De Amerikaanse normen worden per leeftijdsjaar gegeven waardoor bij jongere kinderen sterke leeftijdsbias optreedt bij de grenzen van de jaargroepen.
De voorkeur van Van den Berg en Van Leest blijft uitgaan naar afname van tests waarin zowel ‘fluid’ als ‘crystallized’ testonderdelen zijn opgenomen en deze afzonderlijk beoordeeld worden. Voor kinderen wordt de RAKIT geadviseerd. Weer een vreemd advies omdat bij de RAKIT geen aparte genormeerde totaalscores voor ‘fluid’ en ‘crystallized’ intelligence kunnen worden berekend. Een reden voor de auteurs om de RAKIT aan te bevelen is dat met deze test onderzoek is gedaan bij allochtonen. Uit dit onderzoek blijkt dat bepaalde onderdelen van de RAKIT voor allochtonen minder geschikt zijn voor de bepaling van de intelligentie; het is echter niet mogelijk ze bij de berekening van het IQ buiten beschouwing te laten. In praktisch opzicht is er overeenstemming tussen de voorkeur van Van den Berg en Van Leest en van Evers en Te Nijenhuis voor traditionele tests. Wel stellen de eerste auteurs als eis dat wordt nagegaan of de Nederlandse taal voldoende wordt beheerst om de instructies te begrijpen.

De afgelopen jaren is er vanuit het NIP veel aandacht geweest voor verantwoord testgebruik bij allochtonen. Dit blijkt uit de activiteiten van de Testscreeningscommissie en ook uit de Nieuwe Beroepscode 1998 (NIP, 1997). In het non-discriminatieartikel wordt vereist dat eenieder ondanks verschillen als gevolg van ras, afkomst en etniciteit in dezelfde situatie dezelfde kansen krijgt. Verder wordt in de Algemene Standaard Testgebruik (NIP, 2000) die vorig jaar is verschenen, vereist dat voor niet-Nederlandstaligen onderzocht wordt of de taalvaardigheid van invloed is op de testuitslag. Indien dit het geval is dient naar een alternatief voor de test te worden gezocht. De stellingname van Evers en Te Nijenhuis dat traditionele intelligentests bij allochtonen kunnen worden gebruikt (zonder dat hierbij restricties worden aangebracht), en dat alternatieve tests overbodig zijn geworden, is hiermee volstrekt in strijd. Het feit dat deze uitspraken gedaan worden door een gerenommeerd lid van de COTAN en door een onderzoeker die veel heeft gepubliceerd over testbias, en daarop is gepromoveerd, geeft aan deze stellingname extra gewicht. Of een bevolkingsgroep naar de mening van psychologen een gemiddeld IQ heeft van 90, van 80 of van 70 maakt een groot verschil. Voor de individueel geteste persoon kunnen dergelijke verschillen van doorslaggevende invloed zijn op de mogelijkheden om onderwijs te volgen of om een baan te krijgen. Het is daarom verwonderlijk dat op de oproep tot onverantwoord en discriminerend testgebruik door Evers en Te Nijenhuis in het juninummer van De Psycholoog, van de kant van het NIP geen reactie is gekomen.
Evers en Te Nijenhuis roepen aan het slot van hun artikel op ‘een volgende stap te zetten op weg naar integratie van allochtonen in de Nederlandse samenleving en het onderzoek naar scholing en begeleiding van allochtonen te intensiveren.’ Een nobel steven, maar noch de integratie, noch de scholing van allochtonen is ermee gebaat indien allochtonen op grond van gebrekkige kennis van het Nederlands, op zogenaamd wetenschappelijke wijze, zwakbegaafd worden verklaard.

Literatuur

Bleichrodt, N., Drenth, P.J.D., Zaal, J.N. & Resing, W.C.M. (1984). RAKIT: Instructie Normen Psychometrische Gegevens. Lisse: Swets & Zeitlinger.
Bleichrodt, N. & Van den Berg, R.H. (1997). Voorlopige Handleiding MCT-M Multiculturele Capaciteiten Test Middelbaar niveau. Amsterdam: Stichting NOA.
Brown, L., Sherbenou, R.J. & Johnsen, S.K. (1990). TONI-2. Test of Nonverbal Intelligence. Examiner’s Manual. Austin, TX: Pro-Ed.
Carroll, J.B. (1993). Human cognitive abilities: a survey of factor-analytic studies. Cambridge University Press.
Evers, A. (1999). Beoordelingssysteem voor de Kwaliteit van Tests. COTAN, Commissie Testaangelegenheden Nederland van het Nederlands Instituut van Psychologen, NIP.
Evers, A. & Lucassen, W. (1992). DAT’83 Differentiële Aanleg Testserie. Handleiding. Lisse: Swets & Zeitlinger.
Evers, A. & Te Nijenhuis, J. (1999). Liever speciale dan traditionele cognitieve capaciteitentests voor allochtonen? Een vergelijking. De Psycholoog, 34, 250-255.
Hofstee, W.K.B., Campbell, W.H., Eppink, A., Evers, A., Joe, R.C., Van de Koppel, J.M.H., Zweers, H., Choenni, C.E.S. & Van der Zwan, T.J. (1990). Toepasbaarheid van psychologische tests bij allochtonen. Utrecht: Landelijk Bureau Racismebestrijding. LBR-serie nr. 11.
NIP (1997). Beroepsethiek voor Psychologen. Nieuwe Beroepscode 1998. Amsterdam: Nederlands Instituut van Psychologen.
NIP (2000). Algemene Standaard Testgebruik. Amsterdam: Nederlands Instituut van Psychologen.
Resing, W.C.M., Bleichrodt, N. & Drenth, P.J.D. (1986). Het gebruik van de RAKIT bij allochtoon etnische groepen. Nederlands Tijdschrift voor de Psychologie, 41, 179-188.
Snijders, J.Th., Tellegen, P.J. & Laros, J.A. (1988). Snijders-Oomen niet-verbale intelligentietest: SON-R 5.5-17. Verantwoording en handleiding. Groningen: Wolters-Noordhoff.
Tellegen, P.J., Winkel, M., Wijnberg-Williams, B.J. & Laros, J.A. (1998). Snijders-Oomen Niet-verbale Intelligentietest: SON-R 2.5-7. Handleiding en Verantwoording. Lisse: Swets & Zeitlinger.
Te Nijenhuis, J. (1997). Comparability of test scores for immigrants and majority group members in the Netherlands. Academisch proefschrift, Vrije Universiteit.
Te Nijenhuis, J. & Van der Flier, H. (1997). Comparability of GATB scores for immigrants and majority group members: some Dutch findings. Journal of Applied Psychology, 82, 675-687.
Te Nijenhuis, J. & Van der Flier, H. (1999). Bias research in the Netherlands: review and implications. European Journal of Psychological Assessment, 15, 165-175.
Van den Berg, R. & Van Leest, P. (1999). Praktisch testgebruik bij allochtonen. Wanneer zinnig, nuttig, of waardeloos? De Psycholoog, 34, 256-260.
Van der Flier, H. & Boomsma-Suerink, J.L. (1994). GATB-Handboek (2de editie). Amsterdam/Utrecht: Stichting G.A.T.B.-Research.
Vedder, P. (1999). Migrantenkinderen, ontwikkelingsperspectieven en de psycholoog. De Psycholoog, 34, 261-266.


Summary

Proper test use with immigrants. A comment
P.J. Tellegen

Evers and Te Nijenhuis have stated that traditional intelligence tests can properly be used with immigrants. In this comment we argue that their conclusion is not tenable and discriminating against immigrants. Our criticisms are related to the problems in testing immigrants that are summarized by Van den Berg and Van Leest, however with their recommendations we do not agree. The unbalanced and one-sided view of Evers and Te Nijenhuis is counterproductive to the efforts of the NIP to enhance proper test use with immigrants.


Dr. P.J. Tellegen is werkzaam als universitair docent bij de afdeling
Persoonlijkheids- en Onderwijspsychologie van de Rijksuniversiteit Groningen
Grote Kruisstraat 2/1
9712 TS Groningen
e-mail: p.j.tellegen@ppsw.rug.nl


to top to top to top to top

homepage T&T homepage SON-tests