Wat is Coverage?
Coverage is de mate waarin je testdata alle mogelijke situaties uit de echte wereld vertegenwoordigt — een soort dekking die bepaalt of je AI-model goed voorbereid is op alles wat het tegenkomt.

Wat is coverage eigenlijk?
Stel je voor: je leert iemand autorijden, maar je oefent alleen op rustige woonstraten. Als die persoon dan plotseling de snelweg op moet of in een drukke stad belandt, gaat het mis. Coverage in AI werkt precies zo — het is de mate waarin je trainings- en testdata alle mogelijke situaties, voorbeelden en randgevallen uit de echte wereld vertegenwoordigt.
Als je een AI-model traint om medische scans te beoordelen met alleen foto's van mensen tussen 20-40 jaar, dan heeft je dataset geen goede coverage voor oudere patiënten. Het model heeft die situaties simpelweg nooit gezien. Coverage gaat dus over de vraag: "Heb ik mijn model blootgesteld aan alles wat het in de praktijk tegen kan komen?"
Het begrip komt oorspronkelijk uit softwaretesten, waar je checkt of je testcode alle delen van je programma raakt. In AI draait het om dezelfde gedachte: heb je alle hoekjes en kantjes van de werkelijkheid meegenomen?
Waarom is dit zo belangrijk?
Een model met slechte coverage lijkt misschien fantastisch te presteren in je testomgeving, maar faalt zodra het een situatie tegenkomt die het niet kent. Denk aan:
Een chatbot getraind op alleen formele klantenservice-gesprekken, die vastloopt bij informeel taalgebruik of dialect
Een gezichtsherkenningssysteem met vooral foto's van mensen met een lichte huidskleur, dat daardoor minder accuraat is bij donkere huidstinten
Een fraudedetectiesysteem dat alleen "normale" transacties en bekende fraudepatronen heeft gezien, maar blind is voor nieuwe trucjes
Goede coverage betekent diversiteit: verschillende contexten, randgevallen, uitzonderingen, edge cases. Het is niet alleen "meer data", maar vooral representatieve data. Je wilt dat je dataset een realistische afspiegeling is van de situaties waarin je model straks moet functioneren.
Een voorbeeld uit de praktijk
Een Nederlands bedrijf ontwikkelt een AI-systeem dat CV's screent voor sollicitaties. Ze trainen het model op duizenden CV's uit hun eigen archief. Probleem: die CV's komen vooral van mensen met een universitaire opleiding uit de Randstad. De coverage is slecht voor:
MBO-achtergronden
Niet-westerse namen en opleidingen
Loopbanen met veel kortdurende banen (flexwerkers)
Mensen die later zijn doorgestroomd
Resultaat: het model discrimineert onbedoeld, omdat het deze groepen niet "herkent" als valide kandidaten. Ze hebben simpelweg te weinig coverage in de trainingsdata.
De oplossing? Bewust data verzamelen die deze groepen wél vertegenwoordigt, zodat het model leert dat er veel verschillende routes naar succes zijn.
Waar kom je het tegen?
Coverage is een centraal punt bij het evalueren en verbeteren van AI-systemen:
Bij het samenstellen van datasets — teams checken of alle relevante scenario's en groepen vertegenwoordigd zijn
In medische AI — zorgen dat patiënten van alle leeftijden, etniciteiten en achtergronden in de data zitten
Bij autonoom rijden — testdata moet regenachtige dagen, sneeuw, nacht, verschillende wegtypen en verkeersituaties bevatten
Inspraakherkenning — coverage voor accenten, achtergrondgeluid, verschillende leeftijden en spreekstijlen
Bij fraudedetectie en security — regelmatig nieuwe aanvalspatronen en edge cases toevoegen
Ook in testomgevingen zie je coverage-metrics: welk percentage van de mogelijke inputs en scenarios is getest voordat het model live gaat?
Zo ga je ermee aan de slag
Als je een AI-systeem ontwikkelt of inkoopt, stel dan deze vragen:
Welke situaties kunnen er in de praktijk voorkomen, en zitten die allemaal in de data?
Welke groepen of contexten ontbreken mogelijk?
Zijn er edge cases of uitzonderingen die we over het hoofd zien?
Hoe divers is de data echt — niet alleen in volume, maar in variatie?
Goede coverage is geen eenmalig karweitje, maar een doorlopend proces. De wereld verandert, nieuwe situaties ontstaan, en je model moet mee kunnen. Door bewust te sturen op brede, representatieve data bouw je robuustere AI die niet alleen op papier goed scoort, maar ook in de praktijk betrouwbaar blijft.
Veelgestelde vragen over Coverage
De drie meest gestelde vragen over dit onderwerp, kort beantwoord.
Wat is Coverage?
Coverage is de mate waarin je testdata alle mogelijke situaties uit de echte wereld vertegenwoordigt — een soort dekking die bepaalt of je AI-model goed voorbereid is op alles wat het tegenkomt.
Waarom is Coverage belangrijk?
Stel je voor: je leert iemand autorijden, maar je oefent alleen op rustige woonstraten. Als die persoon dan plotseling de snelweg op moet of in een drukke stad belandt, gaat het mis. Coverage in AI werkt precies zo — het is de mate waarin je trainings- en testdata alle mogelijke situaties, voorbeelden en randgevallen uit de echte wereld vertegenwoordigt.
Hoe wordt Coverage toegepast?
Als je een AI-model traint om medische scans te beoordelen met alleen foto's van mensen tussen 20-40 jaar, dan heeft je dataset geen goede coverage voor oudere patiënten. Het model heeft die situaties simpelweg nooit gezien. Coverage gaat dus over de vraag: "Heb ik mijn model blootgesteld aan alles wat het in de praktijk tegen kan komen?"