Drie keer raden

Bij gesloten vragen hebben kandidaten de kans om het juiste antwoord te raden. Het juiste antwoord is namelijk

Bij gesloten vragen hebben kandidaten de kans om het juiste antwoord te raden. Het juiste antwoord is namelijk ergens te vinden, of het nu in een antwoordalternatief (meerkeuzevraag), in een combinatie (sorteervraag) of ergens op de afbeelding (hotspotvraag) is. Deze raadkans is een doorn in het oog van alle exameninstellingen. Je weet namelijk nooit zeker in hoeverre de score van de kandidaat een weergave is van zijn kennis of van zijn geluk. De enige manier om van die raadkans af te komen, is het overstappen op open vraagtypen en dat is natuurlijk niet altijd wenselijk. Daarom kan de score van de kandidaat gecorrigeerd worden voor raden.

Raadkans heeft te maken met het normeren van een toets. Uit een toets komen toetsscores. Toetsscores hebben op zichzelf geen betekenis. Door een toets te normeren, krijgen toetsscores pas betekenis. Dat normeren doe je wanneer je de cesuur bepaalt: de grens tussen zakken en slagen.

Een toets levert vrijwel altijd scores op, maar de betekenis die je geeft aan de score, bepaalt of je meting van waarde is. Er zijn diverse methodes beschikbaar om toetsen te normeren. Veel van die methodes zijn arbeidsintensief en daarom zie je in de praktijk vaak een intuïtieve benadering van de toets en wordt de norm bepaald door de toetsmaker. Je ziet dan vaak een standaard van cesuur op 55% en vragen die allemaal 1 punt waard zijn. Raadkanscorrectie speelt met name in deze variant van normeren een grote rol.

Bij het afnemen van gesloten vragen, is er altijd sprake van een raadkans. De enige uitzondering hierop is de invulvraag, bij alle andere gesloten vragen kun je door gokken/raden punten behalen. Bij meerkeuzevragen is dat voor veel mensen heel logisch. Er is bij 4 antwoordopties 25% kans dat de kandidaat de juiste kiest, simpelweg doordat de kans 1 op 4 is. Maar ook bij andere gesloten vragen (zoals de matrixvraag, de hotspotvraag, de meervoudig-juistvraag en de matchingvraag) is er sprake van een raadkans. Of men rekening wil houden met de raadkans in de normering, wordt bepaald door de toetsmaker. Uit literatuur blijken verschillende argumenten te zijn om niet voor raadkans te corrigeren. In Nederland is het echter gebruikelijk om dit wel te doen.

We doen dat omdat we betekenis willen geven aan de toetsscores. Wanneer er sprake zou zijn van een toets met alleen open vragen, kun je na de afname zeggen: deze kandidaat beheerst zoveel procent van het inhoudsdomein. Het beheersingspercentage is dan gelijk aan de toetsscore. Bij het gebruik van gesloten vraagtypen, kun je die vergelijking vanwege de raadkans niet maken. De kandidaat heeft per slot van rekening ook alle antwoorden bij toeval juist kunnen kiezen. Hoe kun je dan betekenis geven aan zijn score? We doen dat door de score van de kandidaat te corrigeren voor de raadkans.

Raadkanscorrectie is geen ideale oplossing. Het houdt bijvoorbeeld geen rekening met de vraag of iemand écht heeft geraden. Het is een wiskundige oplossing over iets wat eigenlijk niet wiskundig is op te lossen. Je wilt namelijk weten of de kandidaat over de kennis beschikt en dat doe je niet door een formule los te laten, dan doe je door zijn antwoorden te analyseren.

Het kan namelijk zomaar zo zijn dat een kandidaat het antwoord op de vraag niet weet, maar wel zeker weet dat alternatief 3 en alternatief 4 onjuist zijn. Dan heeft hij voor die vraag (in het geval van een vierkeuzevraag) al 50% raadkans. Maar je berekening houdt rekening met 25%. Strikt gezien is zijn kennis (nog) niet voldoende. Ben je zijn score dan wel juist aan het interpreteren wanneer je rekening houdt met 25% raadkans? Door zijn beperkte kennis kan hij waarschijnlijk meer antwoorden wegstrepen dan iemand met geen kennis (waar de raadkans op is berekend).

Raadkanscorrectie gaat er dus vanuit dat een kandidaat een gesloten vraag benaderd en de kennis heeft of niet heeft. Er zit geen betekenis hiertussen. Je beheerst het of niet. Dat is op zich al niet waar. Kandidaten hebben vaak wel enige kennis over het onderwerp, maar weten het juiste antwoord dan toch net niet te kiezen. Daarnaast hoeft de kans niet 25% te zijn dat de kandidaat kiest voor het juiste antwoord, dan zouden onze vragen zo gelijkmatig beschreven moeten zijn, dat gebeurd eigenlijk nooit. Er zijn altijd antwoordalternatieven die meer aandacht trekken dan anderen.

Daarnaast is het niet zo gezegd dat een kandidaat met geen enkele kennis over het leerstofdomein wel 25% van de vragen juist gaat beantwoorden. Het is immers een kansberekening, maar de werkelijkheid laat vaak iets anders zien.

En toch doen we het zo, omdat er in het geval van intuïtieve normering één van de weinige ingrepen zijn die je kunt doen om de score meer betekenis te geven.

Als het gaat om raadkanscorrectie zijn er drie manieren:

  1. Correctie voor raden

Willekeurig raden is funest voor de validiteit van de score-interpretatie. In deze methode is alles er vooral op gericht om kandidaten ervan te weerhouden om willekeurig te raden, wanneer ze de vraag niet met zekerheid kunnen beantwoorden. Het is een actie die gericht is op het gedrag van de kandidaat.

Voor een fout antwoord wordt de kandidaat bestraft (1 punt aftrek), voor een goed antwoord beloond (1 punt) en wanneer de kandidaat het juiste antwoord niet zeker weet, kiest hij voor ik-weet-het-niet en heeft het geen effect (0 punten).

Er zijn veel nadelen aan deze methode. Een fout antwoord komt niet altijd voort uit het willekeurig gokken. Het kan ook zijn dat een kandidaat wel enige kennis hebt over dit onderwerp, maar nu net deze toepassing verkeerd heeft begrepen. Het kan ook zijn dat hij zich echt teveel heeft laten afleiden door de afleiders in de vraag.

Verder is het vreemd om een kandidaat een strafpunt te geven voor een fout antwoord (kennelijk weet hij het juiste antwoord niet) en ook voor een ik-weet-het-niet-antwoord. In beide gevallen weet hij het juiste antwoord niet, maar voor de ene wordt hij bestraft en de andere telt niet mee.

Het grootste nadeel van deze methode is in meerdere onderzoeken aangetoond en gaat over het bevoordelen van specifieke kandidaten ten opzichte van andere kandidaten. Dat komt voort uit het feit dat er een antwoordstrategie nodig is bij het beantwoorden van dergelijke vragen. Naast het feit dat een kandidaat de vraag moet beantwoorden, moet hij er ook over nadenken hoe zeker hij is van zijn antwoord. Onderzoek laat zien dat dit leidt tot grote verschillen tussen voorzichtige kandidaten (die snel kiezen voor weet-niet antwoorden) en (vaak mannelijke) risiconemers. De risiconemers kwamen er in alle gevallen beter vanaf.

Deze raadkans-methode maakt een toets multi-dimensionaal. Je meet niet alleen de kennis van de kandidaat, maar ook zaken als beslisvaardigheid, risico nemen, strategisch inzicht. Dat bevordert de validiteit van je beslissing niet.

Daarom zie je in de praktijk deze methode niet vaak terug.

  1. Gedwongen raden

In de praktijk zie je meestal de methode ‘gedwongen raden’ terug. De methode dankt zijn titel aan de instructie die kandidaten krijgen wanneer ze een toets maken met deze raadkanscorrectie. Die instructie luidt: geef altijd een antwoord, ook als je het niet weet. Ze worden dus gedwongen om te raden als ze niet goed antwoord kunnen geven op de vraag.

In deze methode wordt berekend hoeveel punten een kandidaat zou hebben als hij ‘blind’ zou gokken op basis van aantal antwoordalternatieven (of scoregebieden in andere gesloten vragen). De scores die vallen binnen dit gok-bereik wordt bestempeld als niet-betekenisvol. En dus adviseren ze om pas boven deze grens de scores om te rekenen naar cijfers. Een aantal scorepunten dat precies op deze grens ligt, levert dan 0 punten op (en alle scores onder deze grensscore ook). De cesuur ligt dan in het scorebereik tussen de gecorrigeerde score en de maximale score.

De normering ziet er dan als volgt uit:

 

Wanneer je de raadkanscorrectie aanzet in RemindoToets is dit de methode die wordt toegepast.

  1. Opnemen in normering

Wanneer we in onze normering inhoudelijk rekening houden met de raadkans, dan wordt deze opgenomen in de cesuurbepaling. Dat gebeurt bijvoorbeeld bij normeringsmethoden zoals de Angoff methode, zie voor meer informatie ons artikel over Normeren in RemindoToets. Deskundigen nemen in hun advies voor het vastleggen van de grens tussen zakken en slagen, de raadkans mee. Je ziet dat in de praktijk de cesuurgrens verder ligt dan de gebruikelijke 55%. Een voorbeeld hiervan, zie je in deze afbeelding.

Welke methode je kiest voor het corrigeren van de score vanwege raadkans is vaak afhankelijk van het doel en de opzet van je toets. Wil je daar hulp bij, aarzel niet om het ons te vragen. We denken graag met je mee.