Dit artikel is ook te downloaden als Word document: klik.

Jump naar de reactie van de BSID auteurs op dit artikel,
en het commentaar daar weer op van Peter Tellegen.


Waarschuwing voor gebruik normtabellen
BSID-II-NL

Peter Tellegen

mei 2005

Tests & Test-research

.

In 2000 is bij Swets Test Publishers de BSID-II-NL verschenen (Van der Meulen, Ruiter, Lutje Spelberg & Smrkovsky) Dit is de Nederlandse versie van de Bayley Scales of Infant Development-II die ontwikkeld is door Nancy Bayley. De test is de opvolger van de BOS 2-30 (Van der Meulen & Smrkovsky). De BSID-II is bedoeld voor kinderen in de ontwikkelingsleeftijd van 1 tot en met 42 maanden. Onder orthopedagogen is dit een van de meest gebruikte ontwikkelingsschalen. De test wordt toegepast bij het onderzoeken en volgen van kinderen met risico op een ontwikkelingsachterstand of –stoornis. Met de test kan worden bepaald of een kind presteert zoals op een bepaalde leeftijd mag worden verwacht, om te bezien of het kind geschikt is voor een interventieprogramma en of toegepaste interventie vooruitgang laat zien.

Gestandaardiseerde observaties van gedragingen die op een gestructureerde manier worden uitgelokt, worden voor de resultaten van de Mentale schaal omgezet in ontwikkelingsindices en/of ontwikkelingsleeftijden. De indices hebben een gemiddelde van 100 en een standaarddeviatie van 15. De score van de Mentale schaal (MS) is derhalve goed vergelijkbaar met het IQ.

De scores op de BSID-II worden gebruikt in het kader van de behandeling en begeleiding van zeer jonge kinderen en op grond van de testuitkomst kunnen belangrijke beslissingen worden genomen. Het is daarom zeer belangrijk dat de normen, betrouwbaarheid en validiteit van een dergelijke test aan hoge eisen voldoen. De test wordt nu echter al een aantal jaren gebruikt zonder dat de Technische handleiding met informatie over deze aspecten is verschenen. Dat de test wordt gebruikt zonder dat men zich een oordeel kan vellen over de kwaliteit is niet verantwoord.

In dit artikel wordt ingegaan op het aspect van de nauwkeurigheid van de leeftijdsnormen. In diverse publicaties (o.a. met betrekking tot de WISC-III NL en de WAIS-III NL) hebben wij erop gewezen dat grote systematische fouten worden gemaakt bij de berekening van IQ-scores indien bij de normering de leeftijdsgroepen te breed worden genomen. Een verschil in leeftijd van 1 dag kan dan betekenen dat het IQ opeens 6 of 8 punten naar beneden gaat. Tot nu toe was een verschil in IQ-score van 21 punten zoals bij de WAIS-III bij de overgang van 65 naar 66 jaar, wel heel extreem.
Maar ook bij de BSID-II blijken dergelijke extreme verschillen in scores op de Mentale schaal regelmatig op te treden bij overgang van de ene naar de andere normtabel. Dit ondanks het gegeven dat de normtabellen tot de leeftijd van 1 jaar per halve maand worden gegeven en daarna per maand. De veranderingen in de ontwikkeling gaan echter zo snel dat meer gedifferentieerde normtabellen bij de BSID-II een noodzaak zijn.

Hieronder worden enkele voorbeelden gegeven van een ruwe score (RS) op de Mentale schaal en de daarbijbehorende Mentale score (MS) in twee opeenvolgende leeftijdsgroepen.

Tabel 1: discrepanties in MS-score bij overgang leeftijdsgroep
.
RS leeftijdsgroep MS leeftijdsgroep MS verschil

12 1 maand 104 1,5 maand 81 23 punten
14 1 maand 114 1,5 maand 90 24 punten
16 1 maand 125 1,5 maand 100 25 punten
18 1,5 maand 110 2 maanden 85 25 punten
45 4 maanden 116 4,5 maand 97 19 punten
90 12 maanden 122 13 maanden 107 15 punten
95 14 maanden 109 15 maanden 96 13 punten
135 24 maanden 108 25 maanden 101 7 punten
177 41 maanden 125 42 maanden 113 12 punten

De verschillen zijn erg groot, vooral bij de leeftijd tot een half jaar. Hier worden systematische fouten gemaakt van 10 tot 15 punten bij de overgang van leeftijdsgroep. De scores zijn dan eigenlijk alleen nauwkeurig in het midden van het leeftijdsinterval. Als de leeftijd daar enkele dagen van afwijkt, is de systematische fout al 5 punten groot. De conclusie kan niet anders zijn dan dat het gebruik van de BSID-II met de huidige normtabellen onverantwoord is.

Een juiste berekening van de genormeerde scores vereist veel meer gedifferentieerde normtabellen die bij de jongste kinderen per dag of per twee dagen gegeven zouden moeten worden. De voor de hand liggende oplossing is echter een simpel computerprogramma waarmee de genormeerde scores kunnen worden berekend. Aangezien de normering is uitgevoerd door middel van een continu normeringsmodel, is dit programma in principe al klaar. Naar verluidt is het uitbrengen van het programma echter door de uitgever tegengehouden aangezien het niet past in hun Test Manager. Gezien de prijs voor de BSID-II van bijna tweeduizend euro, zou het toch geen probleem moeten zijn om een dergelijk programma als losse applicatie bij de test te leveren.

Nog een voorbeeld
Een kind dat geboren is op 12 maart 2005 en dat getest wordt 19 april 2005 heeft een ruwe score van 12. De Mentale schaalscore van dit kind (vergelijkbaar met het IQ) is 104. Een kind dat geboren is op 12 april 2005 en dat getest wordt op 20 mei 2005 heeft ook een ruwe score van 12. Nu is de Mentale score echter 81. Dit is het gevolg van het feit dat het tweede kind in een oudere normgroep komt. In dit voorbeeld zijn beide kinderen echter even oud, nl. 38 dagen. Het ene kind zal beschouwd worden als normaal functionerend terwijl bij het andere kind wordt geconstateerd dat van een aanzienlijke ontwikkelingsachterstand sprake is.

Wat toch steekt in deze situatie, en de BSID is hierin niet uniek, is het feit dat dergelijke fouten gemakkelijk voorkomen kunnen worden maar dat dit blijkbaar niet belangrijk wordt geacht. Omdat veel diagnostici hier gelukkig anders over denken zullen we deze zomer op de website van Tests- en Test-research een programma aanbieden waarmee de normscores op de BSID-II wel nauwkeurig kunnen worden berekend.

Commentaar bij
‘Waarschuwing voor gebruik normtabellen BSID-II-NL’
(2 mei 2005)

Naar aanleiding van de mededeling ‘Waarschuwing voor gebruik normtabellen BSID-II-NL’ in Tests & Test-research, door Peter Tellegen, willen wij het volgende opmerken.

  1. In de binnenkort te verschijnen verantwoording van de BSID hebben we zelf geformuleerd dat de testgebruiker van de BSID met de nodige voorzichtigheid om moet gaan met de normtabellen, vooral bij de jongere leeftijden, waar grote sprongen in ontwikkelingsindices voorkomen. Ook in cursussen voor gebruikers van de BSID werd en wordt nadrukkelijk aandacht aan dit punt gegeven. Een beetje verstandige testgebruiker, en welke testgebruiker is dat niet, gaat natuurlijk uit zich zelf al voorzichtig om met gepubliceerde normtabellen.
  2. Door een van de auteurs van de BSID-II-NL is een computerprogramma geschreven voor het berekenen van de ontwikkelingsindices op basis van de leeftijd in dagen. Het is klaar en komt binnenkort beschikbaar. Peter Tellegen meldt dat hij een dergelijk programma beschikbaar wil stellen. Hoe hij dat kan doen is ons niet duidelijk, want hij beschikt niet over de benodigde empirische data, noch over toestemming om deze data te mogen gebruiken.

We hopen met bovenstaande punten niet de indruk gewekt te hebben dat ze zijn bedacht nadat Tellegens ‘Waarschuwingen ...’ zijn verschenen. Onze teksten liggen al enkele maanden bij de uitgever en aan het computerprogramma is eveneens al geruime tijd geleden begonnen, juist met het oog op het gesignaleerde probleem van de normen.

Bieuwe van der Meulen
Selma Ruiter
Henk lutje Spelberg
Mila Smrkovsky


Nawoord

Peter Tellegen

Het is goed nieuws dat binnenkort een programma beschikbaar komt om de genormeerde scores van de BSID op een nauwkeurige manier te berekenen. Voor mij vervalt daarmee de reden om dat te doen. Voor de wijze waarop ik dat programma zou maken had ik twee alternatieven. Er zou een programma gemaakt kunnen worden waarbij de gebruiker de genormeerde scores (uitgaande van de verkregen ruwe score) voor twee aanliggende normtabellen invoert waarna het programma op grond van de exacte leeftijd interpoleert en de uitkomst berekent. Dit vraagt nog wel vrij veel werk van de gebruiker.

Het is echter ook mogelijk om met de informatie uit de gepubliceerde normtabellen een formule te maken waarmee op grond van exacte leeftijd en de ruwe score, de genormeerde score wordt berekend. Men kan zich afvragen of dit auteursrechtelijk is toegestaan maar aangezien met een dergelijk (gratis) programma de belangen van auteurs en uitgever niet worden geschaad, terwijl de belangen van de gebruikers van de test worden gediend, zou hier toch geen doorslaggevend bezwaar tegen kunnen worden ingebracht.

De BSID wordt nu al enkele jaren gebruikt zonder dat de verantwoording beschikbaar is. De waarschuwing, die in de verantwoording zal worden gepubliceerd, om met de nodige voorzichtigheid de normtabellen te gebruiken, komt dus voor veel gebruikers, en voor veel kinderen die met de BSID zijn onderzocht, te laat. De waarschuwing had beter vanaf het begin van publicatie van de test in grote letters boven iedere normtabel kunnen staan. Nog beter had men eraan gedaan om voldoende gedifferentieerde tabellen te produceren, of men had kunnen wachten met het uitbrengen van de test tot de uitgever bereid was het computerprogramma erbij te leveren.

De auteurs van de BSID stellen in hun reactie dat een beetje verstandige testgebruiker ("en welke testgebruiker is dat niet"), natuurlijk uit zichzelf al voorzichtig omgaat met gepubliceerde normtabellen. Hiermee wordt de verantwoordelijkheid voor verkeerde interpretatie van de tabellen bij de gebruiker gelegd. Dit is echter niet terecht. Als boven een tabel staat:

3 MAANDEN .....2 maanden 23 dagen - 3 maanden 7 dagen

dan mag de gebruiker van de test verwachten dat de weergegeven uitkomsten in deze leeftijdsrange correct zijn en voldoende nauwkeurig. Als dat niet het geval is, en de tabel kan bijvoorbeeld alleen gebruikt worden voor de leeftijd van 2 maanden en 27 dagen tot en met 3 maanden en 3 dagen, dan dient de auteur dit aan te geven. Want wat men moet verstaan onder een “voorzichtige omgang” met de tabellen is wel erg onduidelijk. Bedoelen de auteurs soms dat gebruikers altijd moeten interpoleren? Dat is lastig, bewerkelijk en een bron van rekenfouten.

Helaas hebben de auteurs ook wel gelijk met te stellen dat voorzichtigheid bij het gebruik van normtabellen in het algemeen een noodzaak is. De normtabellen van veel test hebben te brede leeftijdsgroepen waardoor de uitkomsten onnauwkeurig zijn.
Er zijn echter middels continue normeringsmodellen en gecomputeriseerde scoreweergave zulke gemakkelijke methoden beschikbaar om de nauwkeurigheid van de testuitkomst te verbeteren, dat gebruikers noch auteurs afhankelijk hoeven te zijn van te grove tabellen.


to top to top to top to top

homepage T&T homepage SON-tests