In het beroepsonderwijs is de werkdruk hoog. Docenten hebben volle jaartaken en roosters. Een oud-collega van mij verzuchtte eens: “als je de kerstvakantie gehaald hebt, haal je ook de rest van het studiejaar wel”.
Mijn stelling is dat een groot deel van de werkdruk door opleidingen zelf veroorzaakt wordt door veel te veel toetsen gedurende het hele studiejaar. Ik onderbouw deze stelling verderop in deze blog.
Een tweede stelling die ik aan de orde stel is dat die hoeveelheid toetsen niet leidt tot betere resultaten of nog belangrijker tot leren van de student.
Samengevat komen dus drie problemen aan de orde in deze blog:
- We toetsen te veel om het niveau te beoordelen wat leidt tot studenten die door hoepeltjes leren springen en tot werkdruk bij docenten
- De toetsen zijn afzonderlijk niet goed genoeg om beslissingen te nemen over studenten
- Het afnemen van toetsen leidt niet op tot kritische denkers en lerenden maar tot toetsenmakers
We toetsen te veel wat leidt tot werkdruk
Een klein rekenvoorbeeld. Zoals ieder voorbeeld met de nodige aannames. Ik ben steeds voorzichtig in de schattingen. Stel je hebt een beroepsopleiding met 4 eerstejaars groepen van ongeveer 25 studenten. Het onderwijs is gepland in 4 periodes gedurende het jaar. Laten we aannemen dat er per onderwijsperiode 3 toetsen zijn. De 100 studenten maken in het eerste jaar dus 12 toetsen. Wanneer we de toetscyclus er bij nemen kunnen we een inschatting maken van de benodigde tijd per onderwijsperiode.
- 3 docenten maken een toets op basis van de leerdoelen van de periode. Laten we aannemen dat ze hier 1 uur per toets mee bezig zijn = 3 uur.
Totaal: 3 uur - De toets wordt door een collega bekeken en van feedback voorzien, een half uur per toets = 1,5 uur.
Totaal: 4,5 uur - De toets moet worden geprint of digitaal worden klaar gezet, de ruimte ingericht en een surveillant georganiseerd, een half uur per toets = 1,5 uur.
Totaal: 6 uur - De toets wordt afgenomen in een lesuur van 1,5 uur met een docent die surveilleert. Dit is 3 maal 1,5 uur = 4,5 uur.
Totaal: 10,5 uur - Het nakijken van 3 toetsen van 100 studenten. Voorzichtig geschat 15 minuten per toets = 75 uur.
Totaal: 85,5 uur - De toets wordt nabesproken met de studenten in 4 klassen = 4 uur
Totaal: 89,5 uur - De resultaten worden ingevoerd in een studentvolgsysteem, laten we uitgaan van 1 uur
Totaal: 90,5 uur - Dan blijkt dat 10 studenten een onvoldoende hebben per toets en er een herkansing gemaakt moet worden. Het maken van de herkansing voor 3 toetsen. Laten we van een half uur per toets uitgaan = 1,5 uur.
Totaal: 92 uur - Deze toets wordt ook nog door een collega bekeken en van feedback voorzien = 1 uur
Totaal: 93 uur - Printen of klaarzetten van de toets = 0,5 uur
Totaal: 93,5 uur - Afname van de 3 herkansingen, in één lokaal met 1 docent = 1,5 uur
Totaal: 95 uur - De 30 toetsen moeten nagekeken worden. 30 maal 15 minuten = 7,5 uur
Totaal: 102,5 uur - Toets wordt gedurende een uur nabesproken met de studenten en ingevoerd in het volgsysteem = 1 uur
Totaal: 103,5 uur - Tot slot zal er voor 5 mensen nog een derde kans gemaakt moeten worden omdat ze nog geen voldoende hebben gehaald. Laten we die cyclus voorzichtig op 10 uur inschatten.
Totaal: 113,5 uur
Voor deze onderwijsperiode is er in totaal dus 113,5 uur nodig om te toetsen. Voor 4 onderwijsperiodes komt dit neer op 454 uur voor 1 leerjaar. Voor een opleiding met ongeveer 300 studenten die 4 jaar duurt is er meer dan een volledige medewerker nodig (1816 uur) om de toetsen te realiseren. Wanneer we uitgaan van een docent-student ratio van 1:25 dan is er van de 12 medewerkers dus 1 volledig nodig om te toetsen. Dit is 8,3% van je formatie. Een docent is dus een hele onderwijsperiode niet inzetbaar voor het leren van de student, ze zijn bezig om de toetsen te verwerken. Zoals eerder aangegeven: ik denk dat dit een voorzichtige schatting is.
De toetsen zijn afzonderlijk niet goed genoeg om beslissingen te nemen
Ondanks al onze inspanningen zijn afzonderlijke toetsen lang niet altijd betrouwbaar en valide. We gaan ervan uit dat geen enkele toets 100% valide en betrouwbaar is. Dus als we belangrijke en onderbouwde beslissingen moeten nemen, bv bij BSA in het eerste jaar, hebben veel informatie/datapunten nodig. Veel toetsen die meetellen bij de beslissing over bijvoorbeeld het studieadvies aan het einde van het eerste jaar leiden tot studievertraging en uitval. Wanneer we naar de psychometrische gegevens van afzonderlijke toetsen kijken, nemen we een dergelijke beslissing regelmatig op onbetrouwbare metingen. Bovendien wordt de beslissing over een studieadvies nog vaak genomen op basis van een gemiddeld cijfer op de verschillende toetsen. Een beslissing hangt dus af van cijfers en niet van een beargumenteerde beslissing van experts, de betrokken docenten, over de geschiktheid van studenten voor het toekomstige beroep of het voltooien van de opleiding.
In de komende periode zullen we in deze blogs laten zien dat er een goed alternatief is in de vorm van programmatisch toetsen waarin leren en toetsen veel dichter bij elkaar ligt. . De blogs van Liza Peeters-Goos en Cilia de Jong over dit onderwerp zijn al illustratief over betere alternatieven om beslissingen te nemen.
Te veel toetsen leiden niet tot leren
Veel toetsen hebben nog altijd de drie-eenheid: zweten, weten en vergeten. Of zoals Dominique Sluijsmans tijdens het High Impact Teaching Event van 2019 aangaf: “als vergeten het doel is, toets dan of er geleerd is”. Assessement of learning leidt nog vaak tot vergeten. Dochy en van der Vleuten doen daarom in Toetsrevolutie, naar een feedbackcultuur in het hoger onderwijs een warm pleidooi voor assessment as learning (Sluijsmans & Seegers (red), 2018).
De spelregels, werkwijze en praktische consequenties voor het zogenaamde programmatische toetsen werk ik in de komende periode verder uit in deze blogs.
Bronnen
Sluijsmans, D. & Segers, M. (red.) (2018). Toetsrevolutie. Naar een feedbackcultuur in het hoger onderwijs. Uitgeverij Phronese
Wiliam, D. & Leahy, S. (2019). Formatief evalueren in de praktijk. Rotterdam, Nederland: Bazalt Educatieve Uitgaven.
Van Vleuten, C., Schuwirth, L., Driessen, E., Govaerts, M., & Heeneman, S. (2015). Twelve tips for programmatic assessment. Med Teach. 37:641-646
Peter,
Je uren optelling is inderdaad aan de lage kant. Ik denk dat er in de praktijk meer uren nodig zijn. Maar als iets nodig is, dan is het nodig. We kunnen niet zonder toetsen. Formatief of summatief, een student studeert pas echt, grondig en zelfstandig als er een beoordeling aan vasthangt. Ik durf zelfs te stellen dat een student nergens zo veel van leert als van een (goede) toets. Want dan moet hij met de billen bloot. Hij staat er even alleen voor en verstoppen kan niet. De grootste leersprongen die studenten vertonen is overigens niet zozeer te danken aan de toets, maar aan de feedback tijdens de inzage erna. De kwartjes vallen als in een gokautomaat in het casino. Je hebt gelijk: je kunt teveel toetsen, net zoals je doelloos kunt toetsen. Ik ga de blogs met belangstelling volgen.
Dag Henk,
Ik ben ook geen tegenstander van toetsen, integendeel. Het goed inrichten van de toetscyclus is volgens mij van belang om te zien of de leerfunctie van de toets ook echt gerealiseerd wordt. Juist de nabespreking en de feedback blijft vaak achter bij toetsing.
Ik wil graag een evenwichtige beslissing over de 3 functies van toetsen:
1) heeft de student geleerd wat we voor ogen hebben?
2) is het programma dat we voor ogen hebben voldoende om de studenten tot leren aan te zetten
3) voldoet een student aan een vooraf gedefinieerde norm.
Het accent bij toetsing lijkt wel erg vaak naar functie 3 over te hellen en functie 1 en 2 ondergeschikt te zijn. Ik denk dat dit beter kan.