Feedback is één van de meest krachtige invloeden op het leren van mensen, maar de impact van feedback kan zowel positief als negatief zijn. Hoewel de bedoeling van docenten bij het geven van feedback vaak heel goed is, is de feedback inhoudelijk gezien niet altijd even effectief. Zo blijkt uit onderzoek dat docenten jongens vaker feedback geven die gericht is op een gebrek aan inzet (je doet het niet), terwijl de feedback aan meisjes vaker is gericht op een gebrek aan vaardigheid (je kunt het niet). Natuurlijk niet bewust, maar wel een valkuil waar we liever niet in stappen. Zeker omdat het nadelige gevolgen heeft voor de motivatie en mogelijkheden van een leerling. Zorgvuldig feedback geven in het onderwijs is dus van groot belang.

In 1975 deden Carol Dweck en collega’s al onderzoek naar het effect van ‘gebrek aan inzet’ versus ‘het gebrek aan vaardigheid’. Ze kwamen erachter dat wanneer meisjes uit groep 6 zakken voor een taak, de oorzaak werd gezocht in een gebrek aan vaardigheid. Daarna scoorden deze meisjes ook slecht op een cognitieve toets over dezelfde inhoud. Daaruit bleek dat feedback die een gebrek aan vaardigheid beschrijft, invloed heeft op de prestatie in de volgende taak. Voor jongens uit dezelfde groep was dat anders. Hun falen werd vooral geweten aan een gebrek aan inzet. Jongens scoorden daarmee op de volgende taak (de cognitieve toets) beter dan de meisjes.

Dit beeld kwam overeen met de natuurlijke kritiek van docenten op meisjes en jongens. Daar waar meisjes iets niet kunnen, werd de oorzaak vaker gezocht in een gebrek aan vaardigheid, waarmee men tot de conclusie kwam dat de leerling de taak niet aan kon. Van de jongens werd vaker gedacht dat ze er te weinig energie in hadden gestoken. Waardoor de jongens met iets meer inzet toch vertrouwen kregen in het aanpakken van de volgende taak en hier ook beter in presteerden. Dit onderzoek en verder onderzoek van Carol Dweck heeft geleid tot haar theorie over de fixed en growth mindset. Hier kun je een lezing van Carol volgen over deze theorie.

Feedback geven, luistert dus nauw. Er is geen docent die graag het beeld mee geeft dat een leerling een gebrek aan vaardigheid laat zien en toch gebeurt dat. Feedback in het onderwijs is vooral bedoeld om ‘de verschillen tussen de huidige situatie en de doelstellingen te verkleinen’. Onderzoek van Hattie & Timperley (2007) laat zien dat goede feedback leerlingen bewust maakt van hun ontwikkelingen en vorderingen die gemaakt zijn richting het gestelde doel. Om dat voor elkaar te krijgen bieden Hattie & Timperley het volgende feedback-model:

Bron: Hattie, J., & Timperley, H. (2007). The power of feedback. Review of educational research, 77(1), 81-112.

Om een leerling bewust te maken van de ontwikkelingen en vorderingen die zijn gemaakt richting het gestelde doel, moeten docenten drie vragen centraal stellen:

  1. Feed Up: waar ga je naartoe, wat is jouw doel of welke resultaten wil je bereiken?
  2. Feed Back: wat heb je gedaan, hoe heb je het tot nu toe aangepakt?
  3. Feed Forward: wat is je volgende stap, wat ga je verder doen om het doel te bereiken?

In deze video worden de resultaten uit het onderzoek van Hattie & Timperley in het kort nog eens uitgelegd.

Er bestaan volgens het onderzoek van Hattie & Timperley vier niveaus van feedback:

  1. Feedback op de taakuitvoering

“Je hebt 63% juist beantwoord.”

  1. Feedback op het proces

“Kijk nog eens naar deze video en probeer het dan nog een keer.”

  1. Feedback op zelfregulerend werken

“Als je nu terugkijkt op deze taak, wat zorgde ervoor dat het goed ging?”

  1. Feedback op de persoon. Deze feedback wordt niet als effectief gezien.

“Je let niet op.” “Wat ben jij toch een slim kind.” “Zit niet zo te dromen.”  

Feedback op het proces en op het zelfregulerend werken, blijkt het meest effectief te zijn. Feedback op de persoon is minder nuttig, omdat de leerling hier weinig controle over heeft.

Feedback geven is ontzettend belangrijk voor leren en ontwikkelen. Naast het geven van instructie/aanwijzingen is dit de meest invloedrijke interventie die docenten hebben in een klas. Zorgvuldig feedback geven is dus de moeite waard, maar vraagt ook om oefening en reflectie.

Wil je het onderzoek van Hattie & Timperley nalezen? Dat kan hier.


Het gebruik van rubrics bij het beoordelen van opdrachten is populair in ons huidige onderwijs. Een rubric zou de beoordeling van het werk van studenten enorm verbeteren en verrijken, maar hoe zit het eigenlijk met de validiteit? Levert een rubric ook daadwerkelijk een betrouwbaar en valide oordeel op?

Een rubric is een set van beoordelingscriteria, waarmee opdrachten van studenten worden beoordeeld. Een rubric kan zowel holistisch worden gebruikt, als analytisch (of een combinatie van die twee), waarbij in holistische zin de opdracht als geheel wordt beoordeeld en in analytische zin per onderdeel van de opdracht een oordeel wordt gegeven, die samen het eindoordeel bepalen.

Criterium Onvoldoende Matig Voldoende Goed
Kennis en inzicht over de inhoud: het argument Gebrek aan kennis en inzicht over het inhoudsdomein, dat leidt tot een niet-overtuigend argument. Beperkte kennis en inzicht over het inhoudsdomein. Herkenbaar door vage en onduidelijke taal. Geen overtuigend argument. Kennis en inzicht over het grootste deel van het inhoudsdomein. Geeft fragmentarisch een overtuigend argument. Duidelijk kennis en inzicht over het inhoudsdomein. Herkenbaar door duidelijke en concrete taal en complexe ideeën. Sterke, overtuigende en consistente argumenten.

Voorbeeld van beoordelingscriterium uitgewerkt in een rubric

Uit onderzoek blijkt dat beoordelaarsfouten bij het beoordelen van opdrachten helaas veel voorkomen (bijvoorbeeld Gage en Berliner uit 1992). Studenten die een goede schrijfstijl hebben en zich kunnen houden aan de spelling- en grammaticaregels, krijgen hogere cijfers voor hun essays dan studenten die deze vaardigheden niet beheersen. Oók wanneer docenten wordt gevraagd alleen de inhoud te beoordelen. Zelfs interpunctie en fouten in de opmaak van het document blijken een rol te spelen bij de beoordeling van de inhoud. Gage en Berliner (1992) onderzochten de betrouwbaarheid en validiteit van het beoordelen van essays, door een groep van 100 docenten een essay te laten beoordelen, zonder een rubric. Alle docenten beoordeelden hetzelfde essay en scoorden deze op een 100 puntsschaal. Hoewel de docenten dezelfde instructies hadden gekregen, varieerden de cijfers enorm. De scores liepen van 60 tot ruim 90 punten.

De rubric is een instrument dat moet helpen om deze beoordelaarsfouten te voorkomen. Uit onderzoek blijkt ook dat docenten zich zelfverzekerder voelen tijdens het beoordelen, door het gebruik van een rubric (Silvestri & Oescher, 2006). Is dat gevoel dan ook terecht?

Rezaei & Lovorn (2010) deden een poging om deze vraag te beantwoorden, door te kijken naar de vraag of een rubric beoordelaars helpt te voorkomen dat ze teveel aandacht besteden aan de schrijfvaardigheid van de studenten, boven de redeneerkwaliteit, inhoud van de kennis en het logisch denken. Zij deden dit door 326 beoordelaars twee essays te laten beoordelen, eenmaal met en eenmaal zonder rubric. De beoordelaars werden onderverdeeld in 4 groepen. De eerste twee groepen bestonden uit docenten en docenten in-opleiding (71 en 108 personen). De derde en vierde groep waren studenten uit de bedrijfskundige en marketingopleidingen, in de leeftijd van 20 tot 55 jaar (85 en 72 personen).

In het eerste experiment werden groep 1 (docenten) en groep 3 (bedrijfskundigen) gevraagd een essay te beoordelen over de economische globalisatie. Het essay moest daarbij voldoen aan een aantal inhoudelijke eisen en antwoord geven op een specifieke vraag. Essay 1 was bijzonder netjes geschreven, correct qua spelling en grammatica, maar gaf geen antwoord op de gestelde vraag en voldeed daarbij niet aan het belangrijkste criterium.

Groep 2 (docenten) en groep 4 (bedrijfskundigen) kregen een ander essay om te beoordelen, gemaakt met dezelfde opdracht. In dit geval voldeed het essay inhoudelijk aan alle eisen en zou volgens de gegeven rubric hoog moeten scoren. Maar de schrijfvaardigheid liet wat te wensen over. Er stonden 20 structuur-, spelling- en grammaticafouten in.

In de rubric die de beoordelaars kregen, mocht de schrijfvaardigheid beoordeeld worden met maximaal 10 punten. De andere 90 punten ging over het inhoudelijke deel van de opdracht.

De gedachte achter dit experiment was dat de beoordeling met de rubric vermoedelijk tot een betere beslissing zou leiden. Dat het inhoudelijk goede essay daarmee hoger zou scoren, dan het inhoudelijk slechte essay. Helaas bleek het tegendeel waar. Daarnaast zou je verwachten dat het gebruik van de rubric het bereik en de variantie van de gegeven scores zou verminderen, maar ook dat werd niet bereikt. De variantie van de scores steeg zelfs aanzienlijk bij het gebruik van de rubric.
Daarnaast werd duidelijk dat de beoordelaars enorm beïnvloed werden door de schrijfvaardigheid van de student. Het goede essay werd door veel beoordelaars lager beoordeeld dan het slechte essay. Bij navraag gaven die beoordelaars aan, dat ze vonden dat de student in het geval van het slechte essay niet de moeite had genomen om er echt aandacht aan te besteden en de spelling te checken. Hoewel taalvaardigheid maar 10 van de 100 punten had mogen bepalen, speelde het in dit experiment dus toch een grotere rol. Terwijl de rubric daar heel duidelijk over was.
Het foute essay ontving in alle gevallen een resultaat ‘geslaagd’, zélfs op het onderdeel dat ging over het beantwoorden van de gestelde vraag (die door deze student niet werd beantwoord). Ook al proberen beoordelaars zich dus te houden aan de rubric, zij werden toch hevig beïnvloed door de intuïtieve indruk van de tekst wanneer ze deze voor het eerst lazen.

Dat zou betekenen dat het gebruik van een rubric toch niet doet wat het beloofd, maar het niet meer gebruiken van een rubric maakt het niet beter. Er zijn onderzoekers (zoals bijvoorbeeld Elliot) die aangeven dat men zich daarom steeds moet beseffen, dat zelfs met een rubric beoordelaarsfouten voorkomen en zij pleiten voor een portfolio-assessment in plaats van enkele momentopnames. Daarnaast is het ontwerp en vooral het trainen van beoordelaars in het gebruik van een rubric heel effectief gebleken. Het trainen van de beoordelaars is in dit experiment minimaal gedaan. Dat kan een grote rol hebben gespeeld in de uitkomst.

 

Meer lezen over deze en andere onderzoeken:

Rezaei, A.R., & Lovorn, M. (2010). Reliability and validity of rubrics for assessment through writing.

Gage, N. L., & Berliner, D. C. (1992). Educational psychology. Wentzville, MO: Borgasorus Books.

Silvestri, L., & Oescher, J. (2006). Using rubrics to increase the reliability of assessment in health classes. International. Electronic Journal of Health Education, 9, 25–30.


Voor onderwijsinstellingen is de stap naar blended learning vaak al enige tijd geleden genomen. Voor een kleine brancheorganisatie die al jaren klassikale cursussen aanbiedt, is dat een heel ander verhaal. Wanneer er geen onderwijskundig personeel is, wie gaat er dan voor zorgen dat die stap wordt gezet? Vereniging ION ging de uitdaging aan. Op 7 februari j.l. presenteerden zij vol trots hun digitale opleiding in een splinternieuwe leeromgeving.

Vereniging ION is de brancheorganisatie voor iedereen die actief is in de oppervlaktebehandeling industrie. Voorbeelden van oppervlaktebehandelingen zijn natlakken, poedercoaten, anodiseren en verzinken. Vereniging ION heeft zo’n 300 leden, bestaande uit organisaties die deze werkzaamheden uitvoeren. Voor hun leden verzorgt de vereniging al sinds jaren verschillende klassikale opleidingen. De start van een opleiding was altijd afhankelijk van het aantal inschrijvingen.

Bij voldoende inschrijvingen (6 cursisten) kon de opleiding van start gaan. Dat zorgde er wel eens voor dat een cursist even moest wachten, voordat hij kon beginnen. Jacques Schreuder, sectorsecretaris, branchemanager en opleidingscoördinator van Vereniging ION, vond dat altijd ontzettend jammer. “Het is belangrijk als een medewerker graag een cursus wil volgen, die nodig is voor het bedrijf waar hij werkt, hij dan ook snel kan beginnen. Dat konden we met onze cursussen niet voor elkaar krijgen en dat was één van de redenen om te kijken naar een andere manier van opleiden.”

Op basis van die wens heeft de vereniging de beleidsvisie ‘Vakgericht Opleiden 2018-2019’ uitgebracht. “Voor het reguliere onderwijs is het heel lastig om ons vak te doceren. Het is vaak niet kostendekkend. Vereniging ION ziet het daarom als haar plicht om de cursussen aan te bieden, zodat de branche wel de gelegenheid heeft om zijn personeel op te leiden”, zegt Jacques. Voor de verschillende cursussen die de vereniging aanbiedt, ontvangen zij jaarlijks zo’n 300 cursisten. Cursisten zijn altijd werkzaam in de praktijk, daarom is aansluiting van het lesmateriaal bij de praktijk ontzettend belangrijk. “We hebben vorig jaar besloten om met RemindoContent ons cursusmateriaal digitaal aan te bieden. Ik ontdekte als groot voordeel dat je daar alle inhoud in een contentbibliotheek opslaat. Het worden dan losse kralen, die ik later samenvoeg als een ketting die de cursus vormt. Dat betekent dat ik de losse kralen dus ook op andere manieren kan samenvoegen, zodat we beter bij de praktijk van de individuele cursist kunnen aansluiten”, aldus Jacques.

Het valt niet mee voor Jacques om de opleiding om te zetten naar de digitale leeromgeving. “We zitten hier op kantoor met z’n tweeën. Er zijn genoeg ideeën, maar eigenlijk te weinig tijd om het uit te voeren. Nu gaan alle cursusmaterialen door mijn handen en krijg ik de neiging om direct alles te verbeteren, maar ik ben nu tot de conclusie gekomen dat het niet kan. Je kunt niet alles in één keer aanpakken. Dus hebben we besloten om doorgaan met de verbouwing, terwijl de winkel open is. Dat betekent dat ik nu al het lesmateriaal er eerst ‘gewoon’ in plaats en we daarna met behulp van de docenten het gaan verbeteren en verrijken met andere werkvormen.

Het gaat niet zonder slag of stoot, maar ik word er wel heel enthousiast van. Ik zie dat we op deze manier toewerken naar een flexibel opleidingssysteem, dat betaalbaar is en aansluit bij de belevingswereld van nu. Het kost alleen tijd.”

 


De hele klas maakt een toets over de geschiedenis van Frankrijk, voor de toets kun je 100 punten halen. Marieke haalt 30 punten, Renske haalt 60 punten. Kun je dan zeggen: Renske weet twee keer meer over de geschiedenis van Frankrijk dan Marieke? Nee, die conclusie is onjuist.

Uit een toets komen scores. Die scores worden verdeeld over een meetschaal. Er zijn verschillende schaaltypen mogelijk. Zo bestaan er nominale, ordinale, interval- en ratioschalen. De meeste toetsscores worden geïnterpreteerd met behulp van een intervalschaal. Alle schalen hebben hun voor- en nadelen.

Nominale schaal

De nominale schaal is de simpelste schaal. Een nominale schaal deelt informatie op in categorieën, maar volgorde van de categorieën hebben geen betekenis. Bijvoorbeeld: een groep mensen wordt verdeeld op basis van geboorteplaats. De ene geboorteplaats is niet belangrijker of hoger dan de andere geboorteplaats. Het enige wat je kunt doen met deze schaal is de aantallen in de verschillende categorieën tellen en vergelijken welke getallen even groot zijn.

Ordinale schaal

Ordinale schalen rangschikken gegevens met behulp van een aantal of een eigenschap. Bijvoorbeeld: iedereen krijgt een schooladvies vmbo/havo/vwo. Omdat deze schaal wel een logische volgorde heeft, kun je er wat meer mee. Zo kun je wel zien wie een hoger advies heeft gekregen, maar je kunt niet exact zeggen hoeveel hoger. Want de intervallen tussen vmbo en havo, tussen havo en vwo, hoeven niet gelijk te zijn. Je zou wel kunnen zeggen: Herman heeft een hoger advies gekregen dan André.

Intervalschaal

Een intervalschaal rangschikt de informatie zoals een ordinale schaal, maar dan met gelijke eenheden. Op deze schaal worden de meeste toetsscores gelegd, zoals in het voorbeeld uit de inleiding. Het verschil tussen een score van 70 en een score van 71 is op een intervalschaal hetzelfde als het verschil tussen een score van 83 en een score van 84. Daarom kun je met de resultaten uit deze schaal veel berekeningen doen.

En toch mag je niet de conclusie trekken ‘Renske weet twee keer meer dan Marieke’. Dat komt omdat de intervalschaal geen absoluut nulpunt heeft. Daarmee wordt bedoeld dat wanneer iemand op 0 staat in deze schaal, dat dit niet betekent dat de gemeten eigenschap in zijn geheel niet aanwezig is. Dus iemand die op de toets 0 punten scoort kan wel degelijk enige kennis hebben over Frankrijk.

Wanneer je dergelijke conclusies wel wilt trekken, moet je een ratioschaal gebruiken.

Ratioschaal

Een ratioschaal heeft de eigenschappen van een intervalschaal, maar dan met een absoluut nulpunt. Het absolute nulpunt betekent dat de eigenschap die wordt gemeten bij een score van 0 compleet afwezig is. Een ratioschaal gebruik je bijvoorbeeld bij gewicht. Bij 0 kilo is er geen gewicht. Met een ratioschaal mag je wel zeggen: Thijn weegt twee keer zoveel als Astrid. Helaas zijn er maar weinig educatieve toetsen te bedenken met een ratioschaal.

Wat je wel kunt doen, is je houden aan percentage correct. Het is wel mogelijk om in de geschiedenis toets 0% juist te beantwoorden. Daarmee heeft Renske wel twee keer meer punten gehaald dan Marieke.

 


“In de praktijk zie ik veel onzekerheid als het gaat om toetsanalyse en om het bepalen van cesuur. Het zijn beide veelal rekenkundige onderwerpen en dat maakt het voor veel mensen complex, zelfs wanneer alle gegevens beschikbaar zijn. Ik zie het als mijn taak om kennis hierover te delen, zodat we studenten terecht laten zakken of slagen, bovendien is het niet zo ingewikkeld als velen denken”, zegt Harry Molkenboer. Op 28 maart a.s. geeft hij een gratis training bij Paragin voor alle gebruikers van RemindoToets. 

Harry Molkenboer is de eigenaar van Bureau voor Toetsen & Beoordelen. Veel mensen kennen Harry als auteur van boeken over toetsontwikkeling. Dit jaar ontving Harry als één van de eerste personen in Nederland zijn masterdiploma als Toetsdeskundige.

Op donderdag 28 maart a.s. is Harry bij Paragin in Nijkerk. Hij verzorgt die middag een training over toetsanalyse en cesuur bepalen. Tijdens de training krijgen deelnemers concrete handvatten, waarmee ze in hun eigen praktijk toetsen en vragen kunnen verbeteren.

Toetsanalyse

“Ik heb voor het onderwerp toetsanalyse gekozen, omdat een analyse van de zogenaamde toets- en itemindices zoals een p-waarde (moeilijkheid) en een Rir-waarde (onderscheidend vermogen van een vraag), handvatten geven om naar de kwaliteit van de vragen en de toets te kijken. Hiermee kunnen vragen en de toets verbeterd worden voor een volgende afname. Werken met lastige formules is helemaal niet nodig om de analysegegevens uit RemindoToets te kunnen gebruiken. Het gaat om het kunnen geven van betekenis aan de verschillende indices, mede in relatie tot elkaar. Die betekenis ga ik toelichten aan de hand van verschillende voorbeelden. Aan het einde van de middag hebben de indices geen geheimen meer voor je en kun je ze zelf toepassen”, vertelt Harry.

Cesuur

Harry: “Mensen zeggen vaak: de cesuur is een 5,5. Dan zeg ik altijd: wat jij noemt, is een cijfer, maar bij welke score heb je een 5,5? Die score is de cesuur. En waarom wordt daar vaak gedachteloos 55% voor gebruikt? Hoe zit dat bij gesloten vragen en bij open vragen? Door de cesuur te bepalen, neem je als toetsmaker een hele belangrijke beslissing. Je moet het op een goede manier vaststellen, anders weet je niet of de beslissingen zoveel als mogelijk recht doen aan terecht gezakte of terecht geslaagde studenten. Daarom neem ik dit onderwerpen graag mee in de training.”

Het ontwikkelen en afnemen van een goede toets is volgens Harry complex. “Er komt veel bij kijken en het is afhankelijk van veel factoren. Ook van factoren die je niet kunt beïnvloeden. We hebben één ding wel redelijk in de hand: het ontwikkelen van een toetstechnisch goede toets, maar zelfs als je dat helemaal goed doet, is het nog niet 100%.”

Tot slot

“Het is voor mij de uitdaging om die kennis en inzichten aan te reiken die nodig zijn om toetsontwikkelaars goed te kunnen laten toetsen. Omdat we dan de beste beslissing nemen over welke student slaagt en welke zakt. Ik leer je zelf de kwaliteit van je toets te beoordelen. De toetsanalyse is de röntgenfoto van je toets en je vragen. Je moet hem alleen nog goed beoordelen.”

Er is nog een aantal plaatsen vrij voor de training op 28 maart. Wees er snel bij en schrijf je in via Paragin events.


De valkuilen van feedback geven

A: “Zeg, ik wil iets met je bespreken, maar je moet het niet al te persoonlijk opvatten.”

B: “Ok, nou zeg het maar dan.”

A: “Tja, als ik heel eerlijk moet zijn, heb je dit niet echt handig aangepakt.”

B: “Oh ja? Ik vond het eigenlijk heel slim van mezelf.”

A: “Echt waar? Oh, nou… het is natuurlijk maar gewoon mijn mening.”

 

In het onderwijs, het bedrijfsleven en zelfs thuis, overal ben je ermee bezig: feedback geven. Als je wilt dat iets verandert of verbetert, zul je er wel aan moeten beginnen. Je zou het kunnen zien als een cadeautje; je helpt de ander zichzelf te verbeteren, maar is dat wel zo? Is het wel zo’n cadeautje? Vaak levert het helemaal niet zo’n fijn gevoel op, zowel bij jezelf als bij de ander.

De bedoeling van feedback geven is dat de ander inzicht krijgt in zijn gedrag. Daar kan hij dan van leren en iets aan veranderen, maar dat gebeurt eigenlijk alleen maar als die ander dat zelf wil. Als hij feedback krijgt over iets wat hij graag zou willen leren, is dat mooi meegenomen. Maar als het gaat over iets waar zijn interesse helemaal niet ligt, of waarvan hij denkt dat hij dat prima heeft opgelost? Lekker cadeautje is dat. Dan voelt het meer als kritiek en daar worden we allemaal niet veel beter van. Het gevolg is dat het hele feedback geven een nare bijsmaak krijgt. Dat is zonde, want het kan best eenvoudig zijn. Probeer de volgende drie valkuilen te voorkomen:

 

  • Feedback geven wordt verward met iemand aanspreken op gedrag

Iemand feedback geven of iemand aanspreken op zijn gedrag, zijn twee verschillende dingen. Bij het geven van feedback is het doel om de ander inzicht te geven in zijn gedrag en geef je aan wat daar het effect  van is, zodat die persoon zich daar bewust van wordt. Er zit geen oordeel aan vast. Bijvoorbeeld: “Je kwam te laat op de afspraak, ik zat daar met de klant op jou te wachten en voelde me behoorlijk ongemakkelijk.”

Als je iemand aanspreekt op zijn gedrag heeft dat een corrigerend doel. Bijvoorbeeld: “Je bent te laat, zo gaan we in deze organisatie niet om met afspraken. Dit mag niet meer gebeuren.” Als iemand wordt aangesproken op zijn gedrag is dat niet meer vrijblijvend en dat is ook precies de bedoeling. Als je feedback geeft, wil je dat effect niet. Je geeft de ander inzicht en het is aan hem om te bepalen of hij daar iets mee wil doen. Het is bedoeld voor zijn ontwikkeling.

  • Teveel sandwichen

Veel mensen hebben geleerd om de feedback te sandwichen. Een negatief punt wordt dan tussen twee positieve punten verpakt. Bijvoorbeeld: “Wat heb jij veel werk verzet aan dit project zeg. Ik merk wel dat je deadlines niet haalt, daar word ik wel onrustig van. Maar het is wel leuk om te zien hoe enthousiast je bent over het project.” Als je teveel sandwiched, dan kunnen er twee dingen gebeuren:

  • Mensen horen de complimenten niet meer, maar vragen zich af wat nu precies je punt is;
  • Mensen horen het verbeterpunt niet meer, want het lijkt alsof je het zelf al goedpraat.

Vergeet de sandwichmethode en wees concreet. “Ik zie dat je de deadlines niet haalt en daar word ik een beetje onrustig van.” Dan kun je altijd in het gesprek dat hierna volgt je complimenten alsnog geven (als ze gemeend zijn).

In het algemeen is het belangrijk om negatieve feedback goed af te wisselen met positieve feedback, waarbij de positieve feedback iets meer de aandacht krijgt.

  • Mag ik je feedback geven?

Niet alleen voor de feedback-ontvanger, maar ook voor de feedback-gever komt er vaak veel spanning bij kijken. Ergens op de dag moet je er als feedback-gever ineens over beginnen. Wanneer doe je dat en hoe begin je dan? In de praktijk hoor je dan nog vaak de vraag: “mag ik je feedback geven?” Of andere varianten zoals: “mag ik je een tip geven?” Daarmee zet je de feedback-ontvanger meteen op scherp. Hier staat iets te gebeuren en dat wordt niet fijn. Bovendien is het antwoord op die vraag niet verrassend en kan ook voor problemen zorgen. Zegt de feedback-ontvanger ‘ja’, dan kun je beginnen aan het verwoorden van je feedback. Is het ‘nee’, dan heb je eigenlijk meteen een nieuw punt wat je niet fijn vindt aan deze persoon. Sla die vraag daarom maar over. Begin meteen met je constatering, bijvoorbeeld: “Je hebt de stukken niet aangeleverd, zie ik.” of “Je praat wel vaak over haar en niet zo aardig.”

Feedback geven en ontvangen is ontzettend waardevol, niet alleen binnen organisaties en het onderwijs, maar ook in de persoonlijke omgeving van mensen. Het zou zonde zijn wanneer je terughoudend wordt door de complexiteit van de feedback-techniek of het nare gevoel dat je ervan krijgt. De basis van goed feedback geven, ligt bij jouw intentie. Wil je de ander ermee helpen? Dan kan het bijna niet verkeerd gaan.


“De toets moet valide zijn”, daar zijn de meeste toetsmakers het wel over eens. Maar wat als een valide toets helemaal niet bestaat? Waar ben je dan mee bezig als het gaat om validiteit?

Validiteit is misschien wel het belangrijkste kwaliteitsaspect van een goede toets. In de meest eenvoudige beschrijving van validiteit geeft het een antwoord op de vraag: ‘meet de toets wat het beoogt te meten?’ We spreken dan vaak over een valide toets. Hoewel het heel verleidelijk is om te zeggen, klopt het niet helemaal: het bereiken van een valide toets is niet mogelijk. Validiteit heeft te maken met de interpretatie die wordt gegeven aan de toetsscore. Uit de toets komt een score, wat betekent die score? Is iemand geslaagd of gezakt? Kun je op basis van die score met zekerheid zeggen dat iemand die gezakt is niet in staat is om het vak in de praktijk uit te oefenen? Klopt de toets wel bij wat je wilde meten? Je spreekt daarmee dus niet over valide toetsen, maar een valide interpretatie van de toetsscore. Je valideert de beslissing die je neemt op basis van de scores die uit de toets komen.

Validiteit heeft altijd een context nodig en dus een interpretatie. Dezelfde toets kan zowel in grote mate valide zijn als in gebreke zijn, als het gaat om validiteit. Als toetsresultaten voor meerdere doelen worden gebruikt kan dat het geval zijn. Bijvoorbeeld voor het monitoren van iemands voortgang en kijken of iemand geschikt is voor een bepaalde vervolgtraining. In dat geval heeft een toets meerdere doelen en kan de toets voor het ene doel in grote mate valide zijn en voor een ander doel weinig valide zijn.

Een toets kan zelfs voor hetzelfde doel in twee afnames verschillend zijn in mate van validiteit. Zo heeft de ene groep wellicht veel last gehad van de drukte in de examenzaal. Kun je dan wel van de toetsresultaten op aan? Meet het dan nog steeds de toetscriteria die je wilde meten of meet je de mate waarin iemand zich in die onrust kon concentreren op de toets? Terwijl dezelfde toets die afgenomen werd onder goede omstandigheden, een behoorlijk valide interpretatie opleverde.

Er zijn volgens Messick (1994) twee grote bedreigingen voor validiteit:

  • Construct underrepresentation

In dit geval meet de toets niet de belangrijke aspecten van het te meten construct. Het kan bijvoorbeeld zo zijn dat de toets alleen sommige toetscriteria uitgebreid meet en andere toetscriteria helemaal niet aan bod komen. Bijvoorbeeld wanneer een docent een toets maakt en vooral veel vragen stelt over het onderwerp waar hij heel enthousiast over is. Er is ook sprake van construct underrepresentation, wanneer je op basis van de toetsresultaten niet kunt zeggen of de kandidaat het leerstofdomein ook daadwerkelijk beheerst. Dat is bijvoorbeeld het geval wanneer iemand alleen een schriftelijk examen krijgt over iets wat hij in de praktijk altijd fysiek zal moeten uitvoeren. Kun je dan wel met zekerheid zeggen dat deze toets meet of de kandidaat in de praktijk de vaardigheden kan uitoefenen?

  • Construct-irrelevant variance

Er is sprake van construct-irrelevante variance wanneer de toets ook zaken meet die voor het doel van de toets niet van belang zijn. Een voorbeeld van construct-irrelevant variance is wanneer een toets rekenvaardigheid hoort te toetsen, maar de vragen zijn zo lang en uitgebreid beschreven dat het eerder leesvaardigheid toetst. 

Beide bedreigingen kunnen effect hebben op de interpretatie van dezelfde toets. Je vraagt je daarbij steeds af: zijn de interpretaties van de toetsscores geschikt voor het doel van de toets en kloppen ze? Neem ik op basis van de toetsscores in combinatie met het doel van de toets nu de juiste beslissing?

Om goed antwoord te kunnen geven op deze vraag is het belangrijk om validiteit als gezamenlijke verantwoordelijkheid te zien van zowel toetsontwikkelaars, docenten, examencommissie-leden als zelfs de surveillanten en de kandidaten. Je zult zien dat iedereen in zijn rol een andere visie heeft op de validiteit. Met die informatie kun je werken aan het verbeteren van je toetskwaliteit.

Bronnen: 

  • Reynolds, C. R., Livingston, R. B., Willson, V. L., & Willson, V. (2010). Measurement and assessment in education. Upper Saddle River: Pearson Education Internation
  • Messick, S. (1994). The interplay of evidence and consequences in the validation of performance assessments. Educational Researcher, 23, 13-23.

 


Een opdracht kun je als docent in de klas op verschillende manieren uitvoeren: door iedere student individueel, gezamenlijk met de hele klas of in kleine groepjes. In kleine groepjes wordt er verwacht dat studenten in interactie met elkaar leren, in tegenstelling tot het gebrek aan interactie bij individueel leren. Toch kun je er niet zomaar vanuit gaan dat studenten daadwerkelijk praten met elkaar, en wanneer zij wél praten dat dit ook over de opdracht gaat.

Door samen een probleem op te lossen, ideeën uit te wisselen of te discussiëren in kleine groepjes (2-10 studenten), worden meerdere visies besproken en wordt er kennis ingebracht. Dit zorgt ervoor dat studenten van losse kenniselementen één betekenisvol geheel kunnen maken.

Naast het kennisaspect, zorgt de interactie tussen studenten er ook voor dat zij sociale vaardigheden aanleren. Denk bijvoorbeeld aan het leren luisteren naar wat de ander zegt en de ander laten uitpraten. Studenten leren bovendien hun eigen ideeën en mening te verwoorden en te beargumenteren.

Toch laat de praktijk wel eens wat anders zien: studenten gaan van start in groepjes en komen met weinig resultaat terug. Dit is bijvoorbeeld het geval wanneer er geen veilige omgeving is gecreëerd om je idee in te brengen of om kennis te delen. Ook kan het zijn dat niet iedere student de mogelijkheid heeft iets in te brengen, omdat zij de kennisuitwisseling van de andere studenten niet bij kunnen houden. Of dat er tijdens het praten afgedwaald wordt van het doel en er gepraat wordt over koetjes en kalfjes.

Wat kun je hier als docent aan doen?

Om een veilige omgeving te creëren, kun je de studenten aangeven dat zij elkaar uit moeten laten praten en daarna pas mogen reageren op hetgeen er gezegd is of iets nieuws mogen inbrengen. Daarnaast is het belangrijk om alert te zijn, dat de reacties geen persoonlijke aanval, afwijzing of oordeel bevatten. Voornamelijk wanneer er meningen of ideeën ingebracht mogen worden die niet direct gebaseerd zijn op kennis.  Denk bijvoorbeeld aan “Waarom denk jij altijd zo … ?”, “Daar klopt helemaal niks van!” of “Wat een raar argument!”. Leg de studenten daarentegen uit dat zij hun reactie of inbreng bij zichzelf moeten houden en ook begrip naar de andere student kunnen tonen, bijvoorbeeld “Ik begrijp waarom je dat vindt, maar ik vind/ ben van mening dat…”.

Om ervoor te zorgen dat iedere student de discussie kan volgen en iets in kan brengen, kun je als docent de discussie sturen. Geef ze bijvoorbeeld vragen mee waarop de studenten kunnen reageren. Iedere vraag kan voor een (klein) thema in de discussie staan, zodat iedereen weet waar het over gaat en eventueel iets kan inbrengen. Bovendien verklein je met het opknippen van de discussie in verschillende thema’s/ vragen de kans dat de discussie afdwaalt naar koetjes en kalfjes.

Aan het einde van ieder bediscussieerde vraag, kun je vragen of de studenten kort willen samenvatten wat er voor kennis of ideeën er uit zijn gekomen. Zo stimuleer je dat studenten van meerdere losse kenniseenheden één geheel maken. Voor studenten die moeite hebben met het samenvatten van kennis, kan deze manier ook uitkomst bieden. Ze kunnen luisteren naar de samenvatting naar anderen of worden geholpen door de andere studenten een samenvatting te maken.

Je kunt dus als docent een belangrijke rol hebben in het interactieproces van de studenten onderling en de mate waarin er ook daadwerkelijk iets geleerd wordt. Zorg er in ieder geval voor dat je een veilige omgeving creëert waarin iedere student iets durft en kan zeggen en er niet afgedwaald wordt van het doel.


Is het zinvol voor examenkandidaten om de examenvragen nog eens na te lopen en hun antwoorden te verbeteren? Er worden verschillende adviezen over gegeven. Van “Doe dat niet, want je eerste ingeving is meestal de beste” tot “Je kunt de vragen beter wél nalopen, omdat je gedurende het examen tot beter inzicht kunt komen.”
Maar welk advies geef je nu aan je examenkandidaten: moeten ze wel of niet hun antwoorden verbeteren? Onderzoek geeft hierop een antwoord.

Er zijn veel kandidaten die gedurende het examen hun antwoorden aanpassen. Ze gaan dan nog eens terug en wijzigen hun gekozen antwoord. Dat is niet altijd in hun voordeel. Als het gaat om meerkeuzevragen hebben de afleiders in dat geval goed hun werk gedaan. Examenkandidaten krijgen regelmatig het advies om antwoorden op meerkeuzevragen niet aan te passen. “Houd je vast aan je eerste ingeving”, wordt dan gezegd. Uit onderzoek blijkt echter dat kandidaten dat advies beter in de wind kunnen slaan.

Pike (1979) heeft de bevindingen over dit onderwerp van een aantal onderzoekers samengevat en vond een verrassende uitslag.

Wanneer examenkandidaten hun antwoorden aanpassen, is dat volgens het onderzoek meestal in hun voordeel. Tegenover éénmaal waarop het antwoord wordt veranderd naar incorrect, staan twee keren waarop hij zijn antwoord verandert naar correct. Dit is wel vaker het geval bij moeilijkere vragen. Minder moeilijker vragen worden dus minder vaak ten goede verbeterd. Dat lijkt logisch te zijn, omdat je bij moeilijke vragen wellicht met wat langer nadenken tot een betere analyse en dus een beter antwoord komt. Eenvoudige vragen gaan vaak over feitenkennis, wat moet komen uit het semantisch geheugen van kandidaten. Wanneer die kennis er niet is, kun je dat gedurende de toets moeilijk ophalen (tenzij het in een andere vraag toevallig weg wordt gegeven, wat natuurlijk niet de bedoeling is).

Daarnaast komt er uit het onderzoek naar voren dat hoogscorende kandidaten meer profiteren van het aanpassen van een antwoord, dan laagscorende kandidaten. In het algemeen worden er weinig antwoorden gewijzigd, namelijk in gemiddeld 4% van de vragen.

Wat moet dan het advies zijn? Om zomaar te zeggen dat kandidaten vooral hun antwoorden moeten aanpassen, zou behoorlijk kort door de bocht zijn. Waaróm doen zij dat? Dat kan bijvoorbeeld zijn door een beter inzicht, of omdat ze gedurende de toets zich ineens iets herinneren. Maar het kan ook voortkomen uit een onzekerheid en dan kan een aanpassing nadelig effect hebben. Misschien is het beste om er helemaal geen advies over te geven. Kandidaten moeten zich gesteund voelen wanneer ze hun antwoord willen aanpassen, maar het is ook goed wanneer ze dat niet willen. Dan zal, áls men het eerder gegeven antwoord alsnog aanpast, het aanpassen volgens onderzoek zeker kunnen leiden naar een beter resultaat.

Bron: Pike, L. W. (1979). Short-term instruction, testwiseness, and the Scholastic Aptitude Test: A literature review wilt research recommendations. Princeton, NJ: Educational Testing Service


Wijze lessen van de functioneel beheerder

“We werden zo enthousiast en wilden direct beginnen, maar dat ging veel te snel.” Een wijze les van Hans Stoltz, docent en functioneel beheerder van de Hogeschool van Arnhem en Nijmegen (HAN). Vorig jaar ging de HAN voor alle propedeuse studenten van het instituut Financieel Management van start met MijnHANportfolio. Hans Stoltz deelt met ons de vier belangrijkste lessen die hij heeft geleerd van het afgelopen jaar.

1.      De student staat centraal

“De student centraal, dat is ons doel binnen HAN. Vanuit die gedachte vinden we het belangrijk om studenten de beschikking te geven over een ePortfolio. Op die manier kunnen studenten samen met hun begeleidende docenten hun ontwikkeling volgen en meten. In 4 jaar tijd bouwt de student een mooi portfolio op, waar hij op kan terugvallen. Het is van hem en het blijft van hem. Daarin zitten al zijn projecten, beoordelingen en documenten waar hij trots op is.

Voor onze stagiairs en afstudeerders Bedrijfseconomie werkten we al met MijnPortfolio.nl van Paragin en dat bevalt ons enorm, dus het was heel logisch om Paragin uit te nodigen en samen na te denken over de inrichting van MijnHANportfolio.”

2.      Temper je enthousiasme

“We kwamen bij elkaar met de juiste mensen en het balletje ging rollen. Jeroen (directeur Paragin) werd uitgenodigd om MijnHANportfolio te presenteren en iedereen was daar erg van gecharmeerd. Toen Jeroen eenmaal begon te praten, raakte iedereen zó enthousiast dat we allemaal meteen wilden beginnen. Dat was het moment dat we ons misschien hadden moeten afvragen of we niet te snel van start gingen, terwijl nog niet alles was uitgedacht en uitgewerkt. Het was wellicht slimmer geweest om eerst met een klein groepje van één of twee propedeuseklassen een pilot te draaien en niet direct alle 400 studenten toegang te geven.”

3.      Gebruik wat je nu nodig hebt

“De software van Paragin kan zoveel, er zijn ontzettend veel mogelijkheden en opties. De ene optie nog mooier dan de andere. We wilden alles wel gebruiken. Dat was eigenlijk te veel in een te korte tijd. We hadden veel beter eerst kunnen nadenken over wat we precies nodig hadden in dat stadium en het gefaseerd uitbreiden. Wat heb je nodig en hoe krijg je dat zo simpel mogelijk geïmplementeerd? Ik heb gedurende dit proces steeds de steun gehad van Henri en Monique van Paragin. Ik heb zelden een partij ontmoet die zo snel schakelt, meedenkt en oplossingsgericht werkt. Dat heeft enorm geholpen.”

4.      Houd rekening met mogelijk weerstand van gebruikers

“Hoe enthousiast je ook bent over het programma en hoe goed het ook wordt geïmplementeerd, je krijgt altijd te maken met weerstand. De docenten en beheerders zijn degenen die ermee moeten werken. Wanneer zij om de haverklap worden geconfronteerd met een nieuw systeem, zul je daar toch weerstand bij merken. Je loopt altijd tegen wat startproblemen aan. Nu, na een jaar, beginnen docenten te merken dat er wat betreft dit systeem heel snel geschakeld wordt en hebben ze er een groeiend vertrouwen in. Het wordt steeds mooier voor ze om ermee te werken. Ontwikkeling van studenten is zichtbaarder en meetbaarder. We hebben er meer grip op en zijn er nu ontzettend blij mee. ”

1 13 14 15 16 17 19