Direct naar inhoud
Alle termenData, evaluatie & metrics

Wat is Annotation?

Het handmatig labelen van data zodat een AI-model kan leren wat het moet herkennen — zoals het plakken van post-its op foto's met 'dit is een kat' of 'dit is een hond'.

Wat is Annotation

Wat is annotation eigenlijk?

Annotation is het proces waarbij mensen labels, markeringen of notities toevoegen aan ruwe data — zoals foto's, teksten, audio of video — zodat een AI-model kan leren wat het moet herkennen. Stel je voor dat je een kind leert wat een appel is: je wijst naar een appel en zegt "dit is een appel". Dat doe je tientallen keren, totdat het kind het snapt. Annotation werkt precies zo, maar dan met duizenden of miljoenen voorbeelden.

Bij een foto van een hond plak je als het ware een digitaal sticky-note met "hond" erop. Bij een zin in een klantenreview markeer je of de toon positief of negatief is. Bij een medische scan teken je een lijntje rond een tumor. Die gelabelde data wordt vervolgens gebruikt om het AI-model te trainen — zonder die labels weet het model niet wat het moet leren.

Waarom is het zo belangrijk?

Zonder annotation kan een AI-model niet leren onderscheid te maken. Je kunt een computer duizenden foto's laten zien, maar als je er niet bij vertelt wat erop staat, leert hij niks. Annotation is letterlijk de vertaalslag tussen de menselijke wereld ("dit is een stopteken") en de digitale wereld (een patroon van pixels dat het model moet herkennen).

De kwaliteit van je annotation bepaalt grotendeels hoe goed je model wordt. Slordige labels leiden tot verwarring — als je per ongeluk een kat labelt als hond, leert het model die fout aan. Daarom is dit werk vaak arbeidsintensief: teams van mensen bekijken data item voor item en labelen alles zorgvuldig.

Hoe werkt het in de praktijk?

Er zijn verschillende soorten annotation, afhankelijk van het type data:

  • Classificatie: je geeft een heel item één label. Voorbeeld: een e-mail is spam of niet-spam.

  • Object detection: je tekent vakjes rond objecten in een foto en geeft elk vakje een label. Voorbeeld: een zelfrijdende auto moet voetgangers, fietsen en auto's kunnen herkennen.

  • Segmentatie: je kleurt elk pixel dat bij een object hoort, zodat het model de exacte contour leert. Voorbeeld: medische beeldanalyse waarbij een tumor pixel-perfect wordt gemarkeerd.

  • Tekst-annotatie: je markeert woorden of zinsdelen met betekenis. Voorbeeld: in "Ik woon in Amsterdam" markeer je "Amsterdam" als plaatsnaam.

  • Sentiment of intentie: je geeft aan wat de betekenis of toon van een tekst is. Voorbeeld: een chatbericht labelen als "vraag om hulp" of "klacht".

Dit werk wordt vaak gedaan via speciale tools waarin annotators (de mensen die labelen) snel kunnen klikken, tekenen of selecteren. Sommige bedrijven hebben interne teams, anderen besteden het uit aan gespecialiseerde bureaus of platforms waar wereldwijd mensen per taak betaald worden.

Een voorbeeld uit de praktijk

Stel, je bouwt een app die automatisch bonnetjes scant en de bedragen eruit haalt. Je hebt duizenden foto's van bonnetjes nodig. Een team van annotators markeert op elk bonnetje waar het totaalbedrag staat, waar de datum staat, en waar de winkel staat. Die gemarkeerde foto's gebruik je om een model te trainen dat straks zelf die informatie herkent — zonder menselijke hulp.

Of: een ziekenhuis wil een AI die longfoto's controleert op afwijkingen. Radiologen annoteren honderden foto's door cirkels te tekenen rond verdachte plekken en te noteren wat ze zien. Dat gelabelde dataset wordt de basis voor een model dat artsen kan assisteren.

Waar kom je het tegen?

Annotation gebeurt achter de schermen bij bijna elk AI-systeem dat iets herkent:

  • Zelfrijdende auto's: miljoenen camera-opnames waarin voetgangers, verkeersborden en wegmarkeringen zijn gelabeld

  • Spam-filters: e-mails die zijn gelabeld als spam of geen spam

  • Gezichtsherkenning: foto's waarin gezichten zijn gemarkeerd en voorzien van een naam (gevoelig qua privacy)

  • Chatbots: gesprekken waarin intenties en onderwerpen zijn gelabeld

  • Vertalingen: zinnen in twee talen naast elkaar, soms met extra notaties over context

  • Medische AI: röntgenfoto's, MRI-scans en echo's met gelabelde afwijkingen

Er zijn platforms zoals Label Studio, Labelbox en Scale AI die tooling bieden voor annotation-projecten. Veel bedrijven die AI bouwen, besteden een flink deel van hun budget aan het verzamelen en annoteren van kwalitatieve data.

Wat kun jij ermee?

Als je zelf een AI-model wilt trainen, is annotation vaak de eerste stap. Bedenk: wil je een foto-app die planten herkent? Dan heb je duizenden foto's nodig met labels als "roos", "tulp", "cactus". Wil je klantenreviews automatisch sorteren? Dan moet je eerst honderden reviews handmatig labelen op sentiment.

Annotation laat ook zien waarom AI niet zomaar ontstaat: achter elk "slim" systeem zit mensenwerk. Het helpt om realistisch te zijn over hoeveel tijd en moeite het kost om een bruikbaar model te krijgen — en waarom je de mensen die dit werk doen fatsoenlijk moet betalen en begeleiden.

FAQ

Veelgestelde vragen over Annotation

De drie meest gestelde vragen over dit onderwerp, kort beantwoord.

Wat is Annotation?

Het handmatig labelen van data zodat een AI-model kan leren wat het moet herkennen — zoals het plakken van post-its op foto's met 'dit is een kat' of 'dit is een hond'.

Waarom is Annotation belangrijk?

Annotation is het proces waarbij mensen labels, markeringen of notities toevoegen aan ruwe data — zoals foto's, teksten, audio of video — zodat een AI-model kan leren wat het moet herkennen. Stel je voor dat je een kind leert wat een appel is: je wijst naar een appel en zegt "dit is een appel". Dat doe je tientallen keren, totdat het kind het snapt. Annotation werkt precies zo, maar dan met duizenden of miljoenen voorbeelden.

Hoe wordt Annotation toegepast?

Bij een foto van een hond plak je als het ware een digitaal sticky-note met "hond" erop. Bij een zin in een klantenreview markeer je of de toon positief of negatief is. Bij een medische scan teken je een lijntje rond een tumor. Die gelabelde data wordt vervolgens gebruikt om het AI-model te trainen — zonder die labels weet het model niet wat het moet leren.

Deel: