De gevolgen van ai op toetsing

TLDR

Wie wil weten of lerenden iets zelfstandig beheersen in tijden van AI, moet opnieuw kijken naar de hele keten van onderwijsontwerp: leerdoelen, leeractiviteiten, formatief handelen en summatieve beoordeling.

Leerdoelen: bepaal per leerdoel of AI uitgesloten, toegestaan of juist geïntegreerd moet zijn.
Leeractiviteiten en formatief handelen: zet AI zo in dat het denken van lerenden wordt ondersteund of zichtbaar gemaakt in plaats van overgenomen.
Summatieve toetsing: gebruik toetsvormen en toetsprogramma’s die nog geloofwaardig laten zien wat een lerende zelfstandig of verantwoord met toegestane hulpmiddelen beheerst.

Leren en presteren zijn verward geraakt

Cognitief gezien heeft leren betrekking op een verandering in het langetermijngeheugen (Atkinson & Shiffrin, 1968). Het is het overblijfsel van ‘hard nadenken’ (Willingham, 2009) en fouten maken (Clark, 2013; Metcalfe, 2017). Het uiteindelijke doel van leren is dat je informatie opslaat en vaardigheden oefent zodat je het ook in nieuwe situaties, buiten de schoolcontext, kunt inzetten (Kneyber et al., 2022).

In ons onderwijs worden schriftelijke prestaties gezien als bewijs van leren. Dat is al langer een probleem. Je kunt kort voor een toets informatie stampen, goed presteren, en een week later het gros weer vergeten zijn. Het mantra ‘zweten, weten, vergeten’ beschrijft dit treffend. Toch beloont onze toetscultuur het presteren alsof dit het leerproces goed weerspiegelt. Maar het leerproces is toch een beetje een ‘black box’ (Winstone et al., 2026). De docent geeft een opdracht (input), krijgt een afgerond werkstuk terug (output), en wat daar tussenin gebeurt blijft onzichtbaar.

In feite is er een leerzone en een presteerzone (Briceño, 2014). In de leerzone denk je hard na, oefen je en maak je fouten. In de presteerzone laat je zien wat je daadwerkelijk kent en kunt. Beide horen in onderwijs thuis, alleen niet door elkaar heen. AI maakt deze vermenging pijnlijk zichtbaar. Een taalmodel kan een product opleveren dat er goed uitziet zonder dat de lerende het denkproces heeft doorlopen. Hier is ook al een wetenschappelijk artikel voor ingetrokken. Twee onderzoekers claimden positieve effecten van AI op leerprestaties (Wang & Fan, 2025). Alleen ging het hier niet om ‘leren’, maar om ‘presteren’ (iets wat het EAI-model van Hans Visser ook al opmerkte). Wat ons betreft is AI een welkome aanleiding om eindelijk werk te maken van een probleem dat al langer wringt in het onderwijs.

De vraag die leraren nu stellen is “Hoe bewijzen we achteraf dat de leerling het echt zelf heeft gedaan?” (Visser, 2026). Dat resulteert in een zoektocht naar AI-detectie tools — waarvan in onderzoek herhaaldelijk is aangetoond dat ze onbetrouwbaar zijn en resulteren in ongelijkheid — en pogingen om AI volledig buiten de deur te houden (wat onrealistisch is bij opdrachten die op de computer moeten worden gemaakt). Het antwoord zit echter in het onderwijskundig ontwerp. AI verstoort de toets, maar ook de leerdoelen die we stellen en de leeractiviteiten waarin lerenden zich bekwamen. We moeten naar de hele keten van leerdoel tot beoordeling kijken met een onderwijs- én een AI-bril.

In deze blog werken we die keten in drie stappen uit (leerdoelen, leeractiviteiten en toetsing). Bij elke stap laten we zien wat AI ermee doet en wat je er morgen op je school of opleiding aan kunt doen, met aandacht voor het verschil tussen funderend onderwijs en vervolgonderwijs.

Is jullie organisatie voorbereid op de komst van AI? Start de gratis AI-quickscan en krijg een eerste beeld van waar je staat. Bekijk daarna ons volledige aanbod voor opleidingen, workshops en advies op maat.

Start de AI-quickscan

Constructieve afstemming als kader

In goed onderwijs sluiten leerdoelen, leeractiviteiten en toetsing op elkaar aan (Biggs & Tang, 2011). Dat heet constructieve afstemming. Wat we lerenden willen meegeven, bepaalt wat we in de klas of collegezaal laten gebeuren, en dat bepaalt op zijn beurt hoe we toetsen. AI raakt deze drie onderdelen tegelijkertijd.

Diagram van constructieve afstemming: leerdoelen, leeractiviteiten en toetsing met de invloed van AI — AI is van invloed op alle drie de pijlers van constructieve afstemming.

Bij toetsing zelf onderscheiden we twee soorten beslissingen. Een summatieve beslissing draait om een oordeel na een prestatie. Gaat een lerende over of niet? Krijgt een lerende een 5 of een 8? Data uit de leerzone hoort niet in dat summatieve oordeel thuis (Sluijsmans, 2013). Anders verandert oefenen in verkapt presteren en stopt het gedrag dat we juist willen stimuleren. Een formatieve beslissing is een didactische beslissing in de leerzone. Formatief handelen is daarmee een vorm van een leeractiviteit. Het verloopt in drie stappen. Feed up helpt lerenden duidelijk maken waar ze naartoe werken, feedback koppelt terug waar lerenden staan ten opzichte van dat doel en feed forward helpt ze een stap dichter naar het doel toe (Hattie & Timperley, 2007).

Met dit kader kunnen we per onderdeel van de keten kijken wat AI ermee doet en hoe we daar praktisch mee om kunnen gaan. Alleen doen we dat volgens de ontwerpprincipes van backward design (Wiggins & McTighe, 2005). Hierbij begin je bij het leerdoel, vraag je je vervolgens af welk bewijs aantoont dat de lerende het leerdoel beheerst, en pas dan ontwerp je de leeractiviteiten (waaronder ook formatief handelen valt ) die naar dat bewijs leiden. We werken hieronder de drie principes daarom in deze volgorde uit.

Wist je dat we in e-learning 2 'Praktisch aan de slag met AI in het onderwijs' constructieve afstemming als kader gebruiken om aan de slag te gaan met AI-geletterdheid? Het koppelen van AI-geletterdheid aan didactiek is een van de meest effectieve manieren om eraan te werken (Wang & Zhu, 2026).

Bekijk de e-learning

1. Leerdoelen

De eerste vraag in onderwijs is wat je lerenden wilt leren. Welke leerdoelen wil je meegeven en welke kerndoelen moeten van de overheid? En zijn die leerdoelen, gegeven de visie van de school op AI, nog passend nu AI beschikbaar is? Neem de spellingscheck. Wie als doel heeft dat lerenden teksten foutloos kunnen aanleveren, laat toe dat ze tijdens de toets gebruik maken van een spellingscheck. Wie wil dat ze de spellingsregels zelf beheersen, toetst zonder. Voor AI geldt dezelfde logica.

Funderend onderwijs

In het funderend onderwijs liggen de kerndoelen wettelijk vast. Maar binnen dat kader bepaalt de school zelf welke leerdoelen ze daaronder hangt, en juist daar werkt de visie op AI door. Neem het schrijven van teksten. Een school die schrijven ziet als zelfstandig denken via taal, kiest voor leerdoelen waarin zelf formuleren centraal staat en AI er bewust buiten blijft. Een andere school ziet schrijven vooral als communicatieve vaardigheid waarbij het eindproduct telt, en formuleert leerdoelen waarin samenwerken met AI onderdeel is van de schrijfvaardigheid. Beide keuzes zijn binnen de wet te beargumenteren.

Burgerschap krijgt door AI een eigen urgentie. Sinds 2021 is burgerschapsvorming een wettelijke opdracht in het funderend onderwijs. AI raakt die opdracht direct. Het wordt bijvoorbeeld nóg belangrijker om desinformatie zoals deepfakes te kunnen herkennen. Daarnaast komt er een nieuw leerdoel bij. In de definitieve conceptkerndoelen heeft SLO AI-geletterdheid expliciet opgenomen, met ‘AI verkennen’ in het primair onderwijs en ‘mogelijkheden en beperkingen van AI verkennen’ in het voortgezet onderwijs (SLO, 2025).

Hoe begin je?

Voor een school die hiermee aan de slag gaat, helpt het om eerst de visie op AI in het leren expliciet te maken en pas daarna naar leerdoelen en toetsing te kijken. Vervolgens loop je de leerdoelen van een vak langs. Per leerdoel kies je in welke rol AI mag spelen. Je kunt daarbij werken met de vijf niveaus van AI-gebruik van de AI Assessment Scale: geen AI, AI voor planning, AI als samenwerkpartner, volledige AI en ontdekken met AI (Perkins et al., 2024). Er is ook een variant met drie niveaus van AI-gebruik: AI niet toegelaten, AI als hulpmiddel, of AI als integraal onderdeel (KU Leuven Learning Lab, 2025).

Praktische voorbeelden

Po, geschiedenis groep 7. Voor het thema Gouden Eeuw kan een school twee leerdoelen onderscheiden. Het eerste is dat leerlingen kerngebeurtenissen, jaartallen en personen kennen. Het tweede is dat leerlingen informatie over een gebeurtenis kunnen opzoeken en samenvatten. Een school die parate kennis als basis voor latere kritische beoordeling van AI-output beschouwt, kiest voor het eerste leerdoel niveau 1, geen AI. Voor het tweede leerdoel kan diezelfde school kiezen voor niveau 3, AI als samenwerkpartner, of juist voor niveau 1, omdat ze ook willen dat leerlingen zelfstandig leren samenvatten. Een andere school besluit dat AI op deze leeftijd nog helemaal geen rol hoort te spelen en plaatst beide leerdoelen op niveau 1, maar leert leerlingen wel hoe AI tot een antwoord komt en wat daarbij de beperkingen zijn.

Vo, Nederlands 4 havo. Een schrijfopdracht over een actueel thema kent doorgaans twee leerdoelen. Het eerste is dat de leerling zelfstandig een argumentatie kan opbouwen. Het tweede is dat de leerling een tekst kan redigeren op stijl en helderheid. Een school die schrijfvaardigheid ziet als zelfstandig denken via taal, kiest voor beide leerdoelen niveau 1, geen AI. Een andere school kiest voor het eerste leerdoel niveau 1 en voor het tweede niveau 3, AI als samenwerkpartner.

Vervolgonderwijs

In het vervolgonderwijs liggen de eindkwalificaties vast in opleidingsprofielen (hbo en wo) of kwalificatiedossiers (mbo). Binnen dat kader bepaalt de opleiding hoe ze die kwalificaties vertaalt naar leerdoelen, en ook daar werkt de visie op AI door. Het verschil met het funderend onderwijs is dat de student zich voorbereidt op een beroep waarin AI vaak al onderdeel is van de werkpraktijk. Dat geeft de leerdoel-keuze een tweede ankerpunt. Naast de vraag wat de zelfstandige basis is, telt wat een afgestudeerde straks daadwerkelijk doet. Een opleiding die het zelfstandig analyseren als kerncompetentie ziet, formuleert leerdoelen die uitgaan van werken zonder AI. Een opleiding die ervan uitgaat dat AI in het beroep een vanzelfsprekend gereedschap is, formuleert leerdoelen die uitgaan van werken met AI. Een derde opleiding combineert beide en vraagt van studenten dat zij ze allebei beheersen. Welke keuze passend is, hangt af van de visie van de opleiding op het beroep waarvoor ze opleidt.

Praktische voorbeelden

Mbo, Pedagogisch Werk niveau 4. Voor het thema kindontwikkeling kan een opleiding twee leerdoelen onderscheiden. Het eerste is dat de student de stadia van cognitieve ontwikkeling kent. Het tweede is dat de student bij een casus uit de praktijk kan analyseren in welk stadium een kind zich bevindt en welke pedagogische interventie passend is. Een opleiding die parate kennis als basis voor casusanalyse beschouwt, kiest voor het eerste leerdoel niveau 1, geen AI. Voor het tweede leerdoel kan dezelfde opleiding kiezen voor niveau 3, AI als samenwerkpartner, om de student te trainen in kritische beoordeling van AI-gegenereerde adviezen. Een andere opleiding stelt dat in de werkpraktijk altijd met AI wordt gewerkt en plaatst beide leerdoelen op niveau 3.

Hbo Communicatie. Een opdracht over een marktanalyse kent doorgaans twee leerdoelen. Het eerste is dat de student zelfstandig data kan interpreteren en patronen kan herkennen. Het tweede is dat de student een marktanalyse kan opleveren die voldoet aan de standaarden van het werkveld. Een opleiding die zelfstandig analytisch denken als kerncompetentie ziet, kiest voor het eerste leerdoel niveau 1 en voor het tweede niveau 3, AI als samenwerkpartner. Een andere opleiding stelt dat AI in marktanalyses inmiddels onlosmakelijk is verbonden met de werkpraktijk en kiest voor het tweede leerdoel niveau 4, volledige AI met de student als regisseur. In beide gevallen weet de student vooraf welke AI-rol bij welk leerdoel hoort.

2. Validiteitsproblemen en oplossingen voor summatieve toetsing

Bij veel klassieke schriftelijke eindproducten is de validiteitsclaim op zelfstandige beheersing door AI sterk verzwakt (Weidlich, 2026). Veel leraren zoeken daarom naar manieren om AI te verbieden, fraude aan te pakken en AI-gebruik achteraf te detecteren. Detectie biedt geen oplossing. Een algemeen AI-verbod impliceert een verbod op digitale middelen en is buiten gecontroleerde toetsmomenten nauwelijks vol te houden. Bovendien is het voor het ontwikkelen van digitale vaardigheden belangrijk dat lerenden blijven oefenen met digitale leermiddelen. We moeten van het ‘fraude-narratief’ naar een betere oplossing voor het validiteitsvraagstuk.

Risicobeeld per toetsvorm

Welke toetsvormen lopen het meeste risico, en wat helpt? In recente Nederlandse risicoanalyses zijn toetsvormen geclassificeerd op laag, middelhoog en hoog AI-risico (Themagroep AI-Toetsing HAN, 2024/2025; Lerenvantoetsen, 2025; Cents & Zwanenburg, 2026). Per niveau staan in de tabel maatregelen die je kunt stapelen op de toetsvorm. Een belangrijke kanttekening vooraf. Deze maatregelen werken pas wanneer je per toets kiest welke vaardigheid je wilt meten. Een laag AI-risico is op zichzelf geen garantie voor validiteit.

Risico	Toetsvormen	Maatregelen
Laag (AI biedt geen voordeel of is niet toepasbaar)	• Mondelinge toets • Criteriumgericht interview (CGI) • Praktijktoets met live observatie • Beroepshandeling onder direct toezicht • Geroosterde schriftelijke toets in beveiligde omgeving • Geroosterde digitale toets in fraudepreventie-software • Demonstratie of simulatie • Stationstoets, OSCE, of skills-toets met beoordelaar	• Toets transfer en toepassing, niet alleen reproductie • Borg betrouwbaarheid bij mondelinge toetsing met meerdere examinatoren of een vaste vragenset • Controleer of de toetsvorm het beoogde construct écht meet, of alleen wat onder toezicht haalbaar was
Middelhoog (AI inzetbaar voor delen, niet voor het geheel)	• Presentatie • Practicumopname zonder docent erbij • Fysiek beroepsproduct (tekening, model, prototype) • Audiovisuele opdracht • Posterpresentatie • Eindgesprek over een product • Reflectiegesprek (live)	• Voeg vooraf onbekende verdiepingsvragen toe aan het einde van de presentatie • Vraag een procesverantwoording of logboek bij het product • Combineer een opname of artefact met een korte mondelinge toelichting • Beoordeel niet alleen inhoud maar ook vaardigheden die live zichtbaar zijn (uitvoering, presenteren, redeneren onder druk) • Start bij de output van AI-modellen. Wat zouden lerenden laten staan, willen verifiëren of vervangen en waarom?
Hoog (AI kan geheel of grotendeels het werk produceren)	• Thuis geschreven essay • Reflectieverslag of reflectiepaper • Take-home-opdracht • Verantwoordingsverslag • Beoordelingsportfolio met schriftelijke producten • Paper, plan van aanpak, werkplan • Rapport, onderzoeksverslag, scriptie • Resultaatformulier of digitaal beroepsproduct	• Splits de opdracht in tussenstappen die in de klas of onder toezicht worden gemaakt (argumentatieschema, conceptopzet) • Voeg een criteriumgericht interview of nabespreking van tien tot vijftien minuten toe na inlevering • Maak de casus lokaal-specifiek of context-gebonden (eigen wijk, eigen organisatie, klas-eigen data) • Vraag expliciete AI-verantwoording (welke prompts, welke output overgenomen of aangepast, met motivatie) • Daag vaardigheden uit die AI minder goed dekt: kritisch evalueren, contextualiseren, originele synthese • Vraag een keuze-verantwoording bij de eindversie waarin de lerende kort onderbouwt waarom hij voor deze structuur, argumentatie en bronnen heeft gekozen, en welke alternatieven zijn afgewogen • Borg het construct elders in het toetsprogramma met een laag-risico-toets zodat de diplomawaarde niet op één opdracht rust

Bij elke aanpassing geldt een waarschuwing. Sommige aanpassingen die AI-risico verlagen, verlagen tegelijk de validiteit. Een essay dat thuis over meerdere dagen werd gemaakt en nu in een surveilleerzaal binnen drie uur wordt afgenomen, toetst feitelijk een andere vaardigheid (Koenders & Prins, 2024). Per toets moeten we daarom opnieuw kiezen welke aanpassing past bij wat we willen meten. Maar met de juiste aanpassingen kan een toets valide blijven, ook in een wereld met AI.

Wil je dieper duiken in de onbetrouwbaarheid van AI-detectietools en wat er volgens Nederlandse onderwijsorganisaties wél werkt? Lees onze blog over AI-detectie en fraude.

Lees over AI-detectie

Praktische voorbeelden

Po, geschiedenis groep 7. Bij een werkstuk over de Gouden Eeuw mogen leerlingen AI gebruiken om informatie op te zoeken en hun werkstuk te schrijven, mits ze de prompts toevoegen. In de klas leggen ze hun werkstuk uit in een gesprek van vijf minuten met de leerkracht, waarin ze de gemaakte keuzes toelichten. De beoordeling hangt af van het werkstuk én het gesprek.

Vo, profielwerkstuk havo/vwo. We vragen een onderzoek met eigen data, zoals een enquête in de klas, een experiment in het lab, interviews in de buurt of veldwerk. Tijdens het traject leveren leerlingen drie tussenproducten in, namelijk een onderzoeksvoorstel met methodekeuze, een ruwe dataset of veldverslag en een conceptversie van het werkstuk. AI mag voor literatuuronderzoek en taalcorrectie, en de leerling licht in een korte verantwoording achterin het werkstuk toe waar AI is ingezet. Bij de eindversie hoort een gesprek van vijftien minuten waarin de leerling de gemaakte keuzes verantwoordt en op vragen reageert. De beoordeling volgt uit het werkstuk, de tussenproducten en het gesprek.

Hbo Social Work, module-afsluiting. We geven studenten vooraf een AI-gegenereerde casusbeschrijving en vragen hen die te corrigeren, aan te vullen en te onderbouwen met eigen praktijkobservaties. De opdracht wordt daarmee inherent AI-bestendig en traint een bruikbare professionele vaardigheid.

Alleen een toetsprogramma is ‘AI-proof’

Wie een perfecte afzonderlijke AI-proof toets wil toepassen, loopt vast. Als één toets AI-kwetsbaar wordt, hoeft de beoordeling niet direct te sneuvelen zolang andere toetsen in het programma het beeld nog dragen.

In het funderend onderwijs kan een sectie beginnen bij het PTA of PTO. Per toets stellen we twee vragen. Is deze toets door AI kwetsbaar geworden? En levert deze toets ook met AI nog een bruikbaar beeld op van wat de leerling kan? Toetsen die op beide vragen rood scoren, krijgen prioriteit. Focus op “ja-mits” en “nee-tenzij” in plaats van verboden (Themagroep AI-Toetsing HAN, 2024). Een essayopdracht kan blijven, mits er tussenmomenten in de klas zijn en een korte nabespreking. Een onderzoek kan niet meer, tenzij er een interview onderdeel bijkomt.

In het vervolgonderwijs komt bij elke toetsvraag een extra laag. Wat mag een afgestudeerde in het werkveld, en houdt die belofte stand nu AI beschikbaar is? Een veel besproken werkwijze is de twee-banen-aanpak (Liu & Bridgeman, 2023; Beekman et al., 2025). In baan 1 borgt de opleiding de diplomawaarde met toetsen zonder AI of onder toezicht. In baan 2 oefenen lerenden met de werkelijkheid waarin AI in het vak zit. Per opdracht wordt vastgelegd welk niveau van AI-inzet is toegestaan, bijvoorbeeld via de eerder genoemde AI Assessment Scale.

Ten slotte vraagt AI-bestendig toetsontwerp ook om kansengelijkheidsbewustzijn. AI toelaten benadeelt lerenden zonder premium-tools of geoefende AI-vaardigheid. AI uitsluiten en terugvallen op gecontroleerde omgevingen kan bestaande ongelijkheden versterken (Dollinger & Nieminen, 2026). Beide kanten moeten meewegen in elke ontwerpkeuze. Een veilige AI-omgeving kan hierbij een gelijker speelveld creëren.

3. Leeractiviteiten en formatief handelen

Diagram van de feedbackcyclus met de vijf succescriteria voor formatief handelen — Vijf succescriteria voor formatief handelen

Als we weten welk leerdoel we nastreven, en hoe we bewijs van leren verzamelen, volgt daaruit hoe we leeractiviteiten kunnen ontwerpen. Bij de summatieve beslissing ging het over of het oordeel nog klopt. Bij leeractiviteiten gaat het over of het leren überhaupt plaatsvindt. Op elk moment waarop we willen dat de lerende hard nadenkt, mag AI dat denken niet overnemen. Welke momenten dat zijn, hangt af van de leerfase (Visser, 2026). In een oriëntatiefase kan AI misvattingen zichtbaar maken of casussen genereren. In een oefenfase kan diezelfde AI het ophalen uit het geheugen kortsluiten door direct het antwoord te geven. In een reflectiefase kan AI gerichte vragen stellen of de reflectie namens de lerende schrijven. Het is dus de leerfase die bepaalt of AI helpt of het leren ondermijnt.

Als lerenden tijdens bepaalde leerfasen denken niet mogen uitbesteden, moeten we zicht hebben op dat denken. Een waardevolle combinatie van leeractiviteiten, waarmee je voortdurend zicht krijgt op het leren van lerenden, is formatief handelen. “Formatief” heeft betrekking op de didactische beslissing in de leerzone die zich afspeelt langs drie momenten uit de feedback-literatuur (Hattie & Timperley, 2007). Feed up is de afstemming over het doel van de leertaak. Feedback laat de lerende zien waar deze nu staat ten opzichte van dat doel. En feed forward helpt lerenden een stapje dichter naar het leerdoel toe.

Formatief handelen werkt vooral als leraren zicht houden op waar lerenden staan. AI kan dat zicht op twee manieren beïnvloeden. Het kan het zicht ondergraven, omdat lerenden AI kunnen inzetten om denkstappen over te slaan (Zhai, Wibowo, & Li, 2024; Fan et al., 2024). Hoe het ontwerp van leeractiviteiten per leerfase dat ondergraven kan voorkomen, hebben we hierboven al besproken. Interessanter nu, is dat AI datzelfde zicht ook kan vergroten, doordat het patronen in het werk van een hele groep sneller kan signaleren dan een docent en vervolgstappen kan voorleggen (Ningsih, Atmazaki, & Ramadhan, 2026; De Vasconcelos, Başaranoğlu, & Escobar-Castillejos, 2025). AI kan dus optreden als informant voor de docent. Het signaleert misvattingen en suggereert vervolgstappen, de docent weegt af en beslist welke didactische stap volgt.

Hoe deze twee kanten van AI in de praktijk uitpakken, verschilt per onderwijsvorm. In het funderend onderwijs vraagt vooral de oefenfase bescherming. Lerenden bouwen daar basisvaardigheden op die alleen door herhaling en eigen worsteling verankerd raken. AI die oefening wegneemt, ondermijnt de vaardigheid voordat die echt is gevormd. Dat vraagt om afspraken op klas- of sectieniveau, om consistentie tussen klassen te borgen.

In het vervolgonderwijs liggen de knelpunten breder. Studenten oefenen vaak op authentieke beroepstaken waar AI een legitiem onderdeel van uitmaakt. Hier helpt het om een aanpak te kiezen waarin AI-output het startpunt is in plaats van het eindpunt. De student bouwt vakkennis op door AI-output kritisch te bevragen en bij te stellen. Internationaal wordt deze aanpak benoemd als kritisch werken met AI-output (Alzahrani, 2025).

Praktische voorbeelden

Po, taal groep 8, eigen verhaal schrijven. Leerlingen schrijven hun eerste versie zelf, in de klas. Pas daarna mogen ze hun verhaal voorleggen aan een AI die alleen wedervragen stelt zoals “Welk gevoel wilde je hier oproepen?” en geen suggesties doet. De leerlingen kiezen zelf wat ze overnemen. De leerkracht bespreekt patronen klassikaal in de volgende les.

Vo, wiskunde 3 havo, zelfstandig werk. Een AI-tutor ingesteld om geen antwoorden te geven, neemt tijdens zelfstandig werk de rol van hulpoproep over. De tutor rapporteert welke fouten vaak voorkomen. De docent gebruikt die gegevens om de volgende les toe te spitsen op precies die misvatting. Dat is formatief handelen waarin AI informant van de docent is.

Hbo Docentopleiding, lesontwerp. Bij het ontwerpen van een les is het leerdoel dat de student onderwijskundige keuzes zelf leert verantwoorden. De student maakt eerst een lesplan zonder AI, laat AI vervolgens kritische vragen stellen bij dat plan, en herziet daarna het eigen werk in een logboek waarin staat welke AI-suggesties wel en niet zijn overgenomen, met motivatie. De docent gebruikt die logboeken om in de volgende module specifiek aandacht te geven aan keuzes die studenten als groep moeilijk verantwoorden.

Conclusie

We halen leren en presteren in onze toetspraktijk vaak door elkaar. Leeractiviteiten in de leerzone moeten ruimte bieden voor fouten en oefenen. Toetsen in de presteerzone moeten kloppen als oordeel. AI dwingt ons om die twee zones helderder uit elkaar te houden. Leraren en opleidingen kunnen dit doen door vanuit de onderwijskundige visie van de organisatie te kijken naar de invloed van AI op leerdoelen, leeractiviteiten en summatieve toetsing. Om dat herstel te laten slagen, zijn didactische kennis én AI-geletterdheid bij leraren en opleiders een voorwaarde, want AI-bestendige toetsing vraagt om het herontwerp van het hele onderwijsleerproces.

Aan de slag met AI-bestendig toetsen

Wil je met je sectie, opleiding of examencommissie aan de slag met AI-bestendig toetsen? De e-learning “Praktisch aan de slag met AI in het onderwijs” bevat een module over toetsen en constructieve afstemming, met werkvormen per toetstype en een sectie-aanpak. Voor teams die het gesprek in één dagdeel willen voeren, komen we langs voor een in-school workshop. Plan een kennismaking in.

Op de hoogte blijven?

Wil je vaker inhoudelijke blog artikelen lezen over AI, toetsing en didactiek? Meld je dan aan voor onze nieuwsbrief.

Wat doen wij met jouw gegevens? Lees onze voorwaarden.

Verantwoording gebruik AI tools

Het 'AI influence level' van dit artikel is 2:

Claude (Anthropic) — gebruikt voor het structureren van bronnen en een eerste structuur van de tekst
NotebookLM — gebruikt voor het structureren van bronnen

Bronnen

Alzahrani, N. (2025). AI-First Critique Learning (AFCL). Manuscript.

Atkinson, R. C., & Shiffrin, R. M. (1968). Human memory. A proposed system and its control processes. In K. W. Spence & J. T. Spence (Eds.), The psychology of learning and motivation (Vol. 2, pp. 89-195). Academic Press.

Beekman, K., Draaijer, S., Beckers, J., Schagen, E., & Hofman, I. (2025). Aanpakken voor het ontwerpen van AI-gedreven toetstaken. Handreiking 3. Npuls.

Biggs, J., & Tang, C. (2011). Teaching for quality learning at university (4e druk). Open University Press.

Briceño, E. (2014). The biggest barriers to true growth and high performance.

Cents, M., & Zwanenburg, E. (2026). Toetsing en generatieve AI in het voortgezet onderwijs. Kennisnet.

Clark, A. (2013). Whatever next? Predictive brains, situated agents, and the future of cognitive science. Behavioral and Brain Sciences, 36(3), 181-204.

De Vasconcelos, N. A. P., Başaranoğlu, M., & Escobar-Castillejos, D. (2025). AI-enhanced adaptive testing with cognitive diagnostic modeling. Frontiers in Behavioral Neuroscience, 19, 1735237.

Dollinger, M., & Nieminen, J. H. (2026). Reimagining success and failure. Equitable assessment practices in an age of artificial intelligence. Journal of University Teaching and Learning Practice, 23(1).

Fan, Y., Tang, L., Le, H., Shen, K., Tan, S., Zhao, Y., Shen, Y., Li, X., & Gasevic, D. (2024). Beware of metacognitive laziness. British Journal of Educational Technology, 56(2), 489-530.

Hattie, J., & Timperley, H. (2007). The power of feedback. Review of Educational Research, 77(1), 81-112.

Kneyber, R., Sluijsmans, D., Devid, V., & Wilde López, B. (2022). Formatief handelen. Van instrument naar ontwerp. Phronese.

Koenders, L., & Prins, F. (2024). Generative AI in onderwijs en de consequenties voor toetsing. Universiteit Utrecht, Onderwijsadvies & Training.

KU Leuven Learning Lab. (2025, 28 augustus). Herdenk je evaluatie. https://www.kuleuven.be/onderwijs/learninglab/ondersteuning/genai/onderwijsontwerp-en-evalueren/herdenk-je-evaluatie

Lerenvantoetsen (2025). Welke toetsvorm is AI-proof? Visie op toetsing en examinering in het tijdperk van AI. Two-lane approach.

Liu, D., & Bridgeman, A. (2023). Embracing the future of assessment at the University of Sydney. Teaching@Sydney.

Metcalfe, J. (2017). Learning from errors. Annual Review of Psychology, 68, 465-489.

Ningsih, A. G., Atmazaki, A., & Ramadhan, S. (2026). AI-powered adaptive quizzing. Salud Ciencia y Tecnología, 6, 2647.

Perkins, M., Furze, L., Roe, J., & MacVaugh, J. (2024). The AI Assessment Scale (AIAS). Journal of University Teaching and Learning Practice, 21(6).

SLO (2025). Definitieve conceptkerndoelen digitale geletterdheid.

Sluijsmans, D. M. A. (2013). Toetsen op scherp [oratie]. Hogeschool Zuyd.

Themagroep AI-Toetsing HAN (2024). AI-bestendig toetsen. HAN Leernetwerk Toetsing.

Visser, H. (2026). Deelnemen, presteren en het bewijs van leren. Werkdocument.

Visser, H. (2026). EAI-analyse van Your Brain on ChatGPT. Werkdocument.

Wang, C., & Zhu, S. (2026). Bridging AI literacy and AI pedagogy in teacher education and professional development. Manuscript.

Wang, X., & Fan, J. (2025). Effects of AI assistance on student writing and learning [Retracted]. Humanities and Social Sciences Communications.

Weidlich, J. (2026). When students use AI. Toward validity-centered assessment design [Preprint]. OSF. https://doi.org/10.17605/OSF.IO/64QCP

Wiggins, G., & McTighe, J. (2005). Understanding by Design (2nd ed.). ASCD.

Willingham, D. T. (2009). Why don’t students like school? A cognitive scientist answers questions about how the mind works and what it means for the classroom. Jossey-Bass.

Winstone, N. E., Gravett, K., & Elkington, S. (2026). Black Box Assessment. Rethinking integrity and learning for a time of generative AI. Assessment & Evaluation in Higher Education.

Zhai, C., Wibowo, S., & Li, L. D. (2024). The effects of over-reliance on AI dialogue systems on students’ cognitive abilities. Smart Learning Environments, 11(28).