Wat is Active Learning?
Een slimme manier van trainen waarbij het AI-model zelf aangeeft welke voorbeelden het het liefst gelabeld wil hebben — zo leer je met minder handmatig werk hetzelfde resultaat.

Wat is Active Learning eigenlijk?
Stel je voor: je wilt een AI-model trainen om medische scans te beoordelen. Normaal gesproken zou je duizenden scans moeten labelen — een arts moet bij elke foto aangeven of er iets mis is. Dat kost weken, misschien maanden.
Met Active Learning draai je het proces om. Je begint met een klein setje gelabelde voorbeelden. Het model traint daarop en kijkt dan naar alle nog ongelabelde scans. Het wijst zelf de scans aan waar het het meest onzeker over is: "Deze snap ik niet goed, kun je me hier helpen?" Jij labelt alleen díe moeilijke gevallen, en het model leert daar het meest van.
Het is alsof je een kind leert fietsen: in plaats van eindeloos dezelfde rechte weg te oefenen, vraagt het kind zelf: "Mag ik nu die bocht proberen? Dat vind ik nog lastig." Zo leer je sneller, gerichter en efficiënter.
Hoe werkt het in de praktijk?
Het proces ziet er zo uit:
Je begint met een kleine set gelabelde data (bijvoorbeeld 100 voorbeelden)
Je traint een eerste versie van je model
Het model kijkt naar alle ongelabelde data en berekent voor elk voorbeeld: "Hoe zeker ben ik hiervan?"
De voorbeelden waar het model het minst zeker over is, worden aan jou voorgelegd
Jij labelt alleen die lastige gevallen
Het model traint opnieuw, wordt beter, en het proces herhaalt zich
De slimme vraagstrategie heet in vaktaal een "query strategy". Sommige modellen vragen om voorbeelden waar ze het minst zeker over zijn (uncertainty sampling). Andere vragen juist om voorbeelden die heel divers zijn, zodat ze een breed beeld krijgen. Weer andere kiezen voorbeelden die naar verwachting de grootste verbetering opleveren.
Waarom zou je dit gebruiken?
Labelen kost tijd en geld. Een radioloog die duizend scans beoordeelt, een jurist die contracten categoriseert, een bioloog die celbeelden annoteert — dat zijn allemaal dure, gespecialiseerde mensen.
Onderzoek laat zien dat je met Active Learning vaak met 10-30% van de gelabelde data hetzelfde resultaat bereikt als met een traditionele aanpak. Dat scheelt enorm in doorlooptijd en kosten. Vooral bij:
Medische diagnostiek — waar experts schaars en duur zijn
Juridische analyse — contracten, rechtszaken, compliance
Wetenschappelijk onderzoek — denk aan biologische datasets, klimaatmodellen
Klantenservice — welke tickets moet je handmatig nakijken om je chatbot te verbeteren?
Een voorbeeld uit het dagelijks leven
Een verzekeraar wil automatisch schade-claims beoordelen. In plaats van tienduizend claims handmatig te laten nakijken, labelen ze er eerst honderd. Het model leert daarvan en wijst vervolgens aan: "Deze claim lijkt op niets wat ik eerder zag — leg me uit hoe dit zit." Of: "Bij deze twee voorbeelden twijfel ik enorm, ze lijken tegenstrijdig."
De expert labelt alleen die twijfelgevallen. Na een paar rondes herkent het model de meeste standaardsituaties en vraagt alleen nog om hulp bij echte randgevallen. Resultaat: 70% minder labelwerk, zelfde nauwkeurigheid.
Waar kom je het tegen?
Active Learning zit ingebakken in verschillende tools en platforms:
Prodigy — een annotatie-tool die actief de moeilijkste voorbeelden naar voren haalt
Label Studio — open-source platform met Active Learning-ondersteuning
Snorkel AI — combineert Active Learning met andere slimme label-technieken
Amazon SageMaker Ground Truth — biedt Active Learning voor image-classificatie
Modular — heeft Active Learning ingebouwd in hun ML-pipeline
Daarnaast bouwen veel bedrijven het zelf in hun interne AI-pipelines, vooral in sectoren waar expertise schaars is.
Waar moet je op letten?
Active Learning werkt het best als:
Labelen echt duur of tijdrovend is (anders is traditioneel trainen vaak simpeler)
Je genoeg ongelabelde data hebt om uit te kiezen
Je experts beschikbaar zijn voor meerdere label-rondes (het is een iteratief proces)
Je model al redelijk werkt na de eerste ronde (met te weinig startdata kan het niet goed kiezen)
Het is geen wondermiddel: bij hele simpele problemen of als je toch al veel gelabelde data hebt, voegt het weinig toe.
Wat kun je er nu mee?
Als je een AI-project overweegt waar handmatig labelen een bottleneck is, vraag dan na of Active Learning een optie is. Veel moderne ML-platforms ondersteunen het standaard. Begin klein, laat het model zelf aangeven waar het vastloopt, en focus je expertise daar waar het het meest oplevert. Zo bouw je sneller, goedkoper en vaak ook robuuster.
Veelgestelde vragen over Active Learning
De drie meest gestelde vragen over dit onderwerp, kort beantwoord.
Wat is Active Learning?
Een slimme manier van trainen waarbij het AI-model zelf aangeeft welke voorbeelden het het liefst gelabeld wil hebben — zo leer je met minder handmatig werk hetzelfde resultaat.
Waarom is Active Learning belangrijk?
Stel je voor: je wilt een AI-model trainen om medische scans te beoordelen. Normaal gesproken zou je duizenden scans moeten labelen — een arts moet bij elke foto aangeven of er iets mis is. Dat kost weken, misschien maanden.
Hoe wordt Active Learning toegepast?
Met Active Learning draai je het proces om. Je begint met een klein setje gelabelde voorbeelden. Het model traint daarop en kijkt dan naar alle nog ongelabelde scans. Het wijst zelf de scans aan waar het het meest onzeker over is: "Deze snap ik niet goed, kun je me hier helpen?" Jij labelt alleen díe moeilijke gevallen, en het model leert daar het meest van.