Door Jaap Brunnekreef, adviseur leren & toetsen én trainer bij Teelen
Stel je voor: je geeft les aan een brugklas vol leerlingen met verschillende niveaus. Na een paar weken lesgeven is het tijd voor een toets. Maar dan komt de vraag: leggen we alle leerlingen langs dezelfde meetlat? Of laat je het niveau meewegen in de beoordeling? En hoe doe je dat dan op een eerlijke en effectieve manier? Differentiërend toetsen klinkt logisch, maar in de praktijk blijkt het een enorme uitdaging. In deze blog duiken we in de wereld van differentiërend toetsen: hoe kun je recht doen aan de verschillen in niveaus tussen leerlingen, zonder in te leveren op de kwaliteit van de toets?
Heterogene brugklassen
Veel scholen in het voortgezet onderwijs werken met een heterogene brugklas, ook wel een brede brugklas of dakpanklas genoemd. Voor de coronacrisis werkten al veel scholen met een brede brugklas of dakpanklas, maar door de subsidieregeling van het Nationaal Programma Onderwijs (NPO) is het aantal scholen dat een heterogene brugklas aanbiedt aanzienlijk toegenomen. Op het eerste gezicht lijkt dit een goede ontwikkeling. Echter, veel scholen worstelen nu met de vraag hoe ze op het einde van het schooljaar op een goede (en onderbouwde) manier kunnen differentiëren tussen de verschillende onderwijsniveaus van hun leerlingen. Dit is een complexe uitdaging.
Differentiërend toetsen: wat weten we eigenlijk?
Opvallend genoeg is er weinig specifieke literatuur te vinden over hoe je, met oog voor niveauverschillen, kunt toetsen in een heterogene brugklas. De meeste publicaties richten zich vooral op differentiatie in de lespraktijk [1]. Denk aan klassikale instructie voor de snelle leerlingen en verlengde instructie voor wie meer ondersteuning nodig heeft. Onderzoek naar differentiatie gaat vaak over de effectiviteit ervan: draagt het bij aan betere leerprestaties? [2] [3] En hoeveel informatie (datapunten) heb je eigenlijk nodig om goed te kunnen differentiëren? [4] Maar als het gaat om toetsing in een dakpanklas, lijkt het onderwerp vooral in Nederland te spelen en blijft het antwoord op de vraag hoe je dat het beste aanpakt, vaak uit.
Twee cijfers voor één toets: werkt dat wel?
Om te kunnen differentiëren, wordt op veel scholen in het voortgezet onderwijs voor één toets twee keer een cijfer berekend: één voor het lagere en één voor het hogere schoolniveau. Denk bijvoorbeeld aan een toets in een dakpanbrugklas waarbij zowel een cijfer op havo- als een vwo-niveau wordt gegeven. Vaak gebeurt dit door simpelweg een strengere cesuur te gebruiken voor het hogere niveau.
Uitgangspunt hierbij is dat álle leerdoelen even belangrijk zijn én dat deze op het hogere niveau automatisch zwaarder moeten wegen. Maar klopt die aanname wel? Is het niet logischer om te kijken welke leerdoelen specifiek bij het hogere niveau behoren en alléén voor die toetsvragen een strengere cesuur toe te passen?
Hoe het ook kan
In plaats van een strengere cesuur te hanteren voor alle toetsvragen op het hogere niveau, kun je ook differentiëren in de puntentoekenning per vraag.
Stel dat een toetsvraag specifiek een vwo-leerdoel toetst. Dan is het logisch om die vraag zwaarder mee te laten tellen voor het vwo-cijfer dan voor het havo-cijfer. Heeft een leerling deze vraag goed, dan krijgt hij bijvoorbeeld 10 punten voor het vwo-cijfer en 5 punten voor het havo-cijfer. Maakt hij de vraag fout, dan mist hij dus relatief meer punten voor het vwo-cijfer dan voor het havo-cijfer.
Op deze manier maak je in je toets zichtbaar onderscheid tussen de niveaus, zonder dat je twee aparte toetsen hoeft te maken.
Voorbeeld: een toets Engels
Om te laten zien hoe differentiërend toetsen er in de praktijk uit kan zien, heb ik een eenvoudig voorbeeld uitgewerkt voor het vak Engels. In deze fictieve toets worden drie leerdoelen getoetst, elk met een eigen toetsopgave:
- De leerling kan de woordjes uit hoofdstuk 2.1 reproduceren (5 toetsopgaven).
- De leerling kan het werkwoord ‘to be’ correct vervoegen (5 toetsopgaven).
- De leerling kan een passende titel boven een alinea formuleren (1 toetsopgave).
Deze leerdoelen verschillen in complexiteit en abstractieniveau, waardoor ze zich goed lenen voor differentiatie in puntentoekenning. In de volgende alinea laat ik zien hoe je dat kunt aanpakken.
De kolommen zijn ingedeeld op drie niveaus:
- Reproduceren /Begrijpen
- Toepassen
- Analyseren, Evalueren en Creëren
Daarbij heb ik in de kolom ‘aantal punten’ onderscheid gemaakt tussen havo en vwo. In het rode kader zie je hoe de puntentoekenning per vraag verschilt per niveau. Zo wordt zichtbaar hoe je binnen één toets kunt differentiëren, zonder aparte versies te maken voor elk niveau.

Verschil in puntentoekenning
Voor leerdoelen waarvan je als docent verwacht dat ze op vwo-niveau meer diepgang of complexiteit vragen dan op havo-niveau, kun je een verschil in puntentoekenning aanbrengen. Neem bijvoorbeeld de laatste opgave uit de toets: de leerling moet een passende titel formuleren boven een Engelse tekst, die zowel de inhoud goed samenvat als grammaticaal correct is. Dit is een complexe taak die vraagt om goed tekstbegrip én taalvaardigheid – vaardigheden waarin vwo-leerlingen zich mogelijk sterker onderscheiden.
Voor zo’n opgave kun je ervoor kiezen om deze zwaarder te laten meewegen in het vwo-cijfer dan in het havo-cijfer. Daarmee maak je het onderscheid in beheersingsniveau zichtbaar in de beoordeling.
Voor leerdoelen waarbij je géén wezenlijk verschil verwacht tussen havo- en vwo-leerlingen – zoals het reproduceren van woordjes of het correct vervoegen van het werkwoord to be – kun je dezelfde puntentoekenning gebruiken voor beide niveaus. Zo differentieer je doelgericht, zonder onnodige complexiteit toe te voegen aan je toets.
Rit-waarde: objectieve onderbouwing
Of een leerdoel typisch bij het vwo-niveau hoort en dus zwaarder mag meewegen in de puntentoekenning, is vaak een inschatting van de docent. Toch kun je die inschatting ook objectiever onderbouwen – bijvoorbeeld met behulp van de Rit-waarde.
In mijn blog ‘Wat is de gouden vraag in jouw toets?’ besprak ik al de kracht van deze statistische maat. De Rit-waarde staat voor een correlatie coëfficiënt (R) die de relatie aangeeft tussen de score op een specifieke vraag (item) en de totale score op de toets. De Rit-waarde geeft aan hoe goed een toetsvraag onderscheid maakt tussen leerlingen die over het algemeen hoog scoren en leerlingen die lager scoren. Met andere woorden: behalen de sterkere leerlingen vaker punten op deze vraag dan de zwakkere leerlingen?
Door achteraf de Rit-waarde van een toetsvraag te berekenen, kun je nagaan of een vraag die bedoeld was om een vwo-leerdoel te toetsen, ook daadwerkelijk onderscheidend was. Scoorden de hoog presterende leerlingen inderdaad beter op deze vraag dan de laag presterende? Dan bevestigt dat je keuze om deze vraag zwaarder te laten meewegen in het vwo-cijfer.
Hoeveel onderscheidende vragen er daadwerkelijk in je toets zitten, weet je vaak pas achteraf. Natuurlijk heb je als ervaren docent een goed onderbuikgevoel, maar uiteindelijk zul je moeten onderbouwen – met data uit je toetsanalyse – in hoeverre een toetsvraag (en het bijbehorende leerdoel) daadwerkelijk onderscheidend is.
Samenvattend
Door bewust te kijken naar de leerdoelen in je toets en deze verschillend te waarderen voor leerlingen in een heterogene brugklas, kun je op een effectieve manier differentiëren binnen één toets. In plaats van te werken met een uniforme cesuur, geef je toetsvragen die complexere of abstractere leerdoelen toetsen – zoals het formuleren van een passende titel bij een Engelse tekst – meer gewicht in het vwo-cijfer dan in het havo-cijfer.
Voor leerdoelen die op beide niveaus vergelijkbaar zijn, zoals het reproduceren van woordjes of het vervoegen van werkwoorden, hanteer je een gelijke puntentoekenning. Zo ontstaat een toets die recht doet aan de verschillen in niveau, zonder dat je aparte toetsen hoeft te maken.
De ervaring van de docent speelt hierin een belangrijke rol, maar met behulp van de toetsanalyse – zoals het berekenen van de Rit-waarde – kun je deze keuzes ook onderbouwen met data. Zo werk je aan een toetspraktijk die zowel eerlijk als inzichtelijk is en het mogelijk maakt om differentiërend te toetsen binnen een dakpanklas.
Wil je meer weten over differentiërend toetsen, volg dan één van onze trainingen.
Literatuur
[1] Rapport ResearchNed. (2017). Differentiëren en differentiatievaardigheden in het voortgezet onderwijs
[2] Deunk, M., Doolaard, S., Smale-Jacobse, A., & Bosker, R. J. (2015). Differentiation within and across classrooms: A systematic review of studies into the cognitive effects of differentiation practices. RUG/GION
[3] Kennisrotonde. (2015). Is het waar dat brede brugklassen bijdragen aan de plaatsing van leerlingen op het opleidingsniveau dat het beste past bij hun capaciteiten? (KR 001). Den Haag: Kennisrotonde
[4] Peeters W. (2024). Toetsen in een brede brugklas. Vernieuwenderwijs