Direct naar inhoud
Alle termenData, evaluatie & metrics

Wat is ImageNet?

Een gigantische database met miljoenen gelabelde foto's, die jarenlang de standaard was om te testen hoe goed AI-systemen plaatjes kunnen herkennen.

Wat is ImageNet

Wat is ImageNet eigenlijk?

ImageNet is een enorme verzameling van meer dan 14 miljoen foto's, allemaal keurig gelabeld met wat erop staat. Denk aan foto's van katten, auto's, bloemen, gereedschap — verdeeld over ruim 20.000 categorieën. Onderzoekers van Stanford hebben deze database vanaf 2009 opgebouwd, met als doel: een soort 'woordenboek in beelden' maken waarmee AI-systemen kunnen leren zien.

De database werd beroemd door de ImageNet Large Scale Visual Recognition Challenge, een jaarlijkse wedstrijd van 2010 tot 2017. Onderzoeksteams uit de hele wereld probeerden wie het beste AI-model kon bouwen om objecten op foto's te herkennen. Stel je voor: je krijgt een foto van een golden retriever, en de AI moet zo precies mogelijk zeggen wat het is.

Waarom was dit zo'n doorbraak?

In 2012 gebeurde er iets bijzonders. Een team gebruikte een deep learning-model (AlexNet) dat plots veel beter presteerde dan alle vorige methoden. Het foutpercentage zakte van 26% naar 15% — een gigantische sprong. Dit moment wordt vaak gezien als het startschot van de moderne AI-revolutie.

ImageNet toonde aan dat neural networks konden leren 'zien' als ze maar genoeg voorbeelden kregen. Net zoals jij als kind leert wat een hond is door er tientallen te zien, leerden deze modellen patronen herkennen door miljoenen foto's te bestuderen.

Hoe werkt het in de praktijk?

Onderzoekers gebruikten ImageNet op twee manieren:

  • Als testset: train je AI-model op andere data, test het dan op ImageNet om te zien hoe goed het objecten herkent

  • Als trainingsdata: leer je model eerst op ImageNet, pas het daarna aan voor specifieke toepassingen (dit heet transfer learning)

Die tweede aanpak blijkt enorm krachtig. Een model dat geleerd heeft katten, auto's en bloemen te onderscheiden, heeft al veel basiskennis over vormen, kleuren en patronen. Die kennis kun je hergebruiken voor andere taken — bijvoorbeeld röntgenfoto's analyseren of productiefouten in een fabriek herkennen.

Waar kom je het tegen?

ImageNet zit verweven in vrijwel elk modern computer vision-systeem:

  • Smartphone-camera's die automatisch gezichten, dieren of planten herkennen, gebruiken vaak modellen die ooit op ImageNet zijn getraind

  • Medische beeldanalyse begint vaak met een model dat op ImageNet is voorgetraind, daarna verder getraind op röntgenfoto's of MRI-scans

  • Zelfrijdende auto's herkennen voetgangers en verkeersborden met technieken die uit ImageNet-onderzoek voortkwamen

  • E-commerce platforms die visueel zoeken aanbieden (upload een foto, vind vergelijkbare producten) bouwen voort op ImageNet-principes

Bekende modellen die op ImageNet zijn getest: ResNet, VGG, EfficientNet, Vision Transformers.

Kritiek en wat erna kwam

ImageNet kreeg ook kritiek. Sommige categorieën bleken racistische of denigrerende labels te bevatten. Daarnaast waren veel foto's vooral gericht op Westerse contexten, waardoor modellen slechter presteerden op foto's uit andere delen van de wereld.

Sinds 2017 is de officiële competitie gestopt. Inmiddels bestaan er nieuwere datasets die breder, diverser of specifieker zijn. Toch blijft ImageNet een ijkpunt — als je zegt dat je model 'ImageNet-niveau' haalt, weet iedereen in de AI-wereld wat je bedoelt.

Een voorbeeld uit de praktijk

Stel: je wilt een app bouwen die plantensoorten herkent. Je hebt maar 500 foto's van Nederlandse tuinplanten. Dat is te weinig om een goed model helemaal vanaf nul te trainen. Maar als je begint met een model dat al op ImageNet is getraind — dus al weet wat bloemblaadjes, stengels en bladeren zijn — dan kun je met die 500 foto's wél een betrouwbare planten-app maken. ImageNet fungeert dan als een soort 'basisopleiding' die je verder specialiseert.

Wat kun je ermee?

Als je zelf met beeldherkenning aan de slag gaat, loop je gegarandeerd tegen ImageNet aan. Begrijp dat vrijwel elk pre-trained model (modellen die je kant-en-klaar kunt downloaden) zijn kennis deels aan ImageNet te danken heeft. Het helpt om te weten waar die basiskennis vandaan komt — en waarom sommige modellen bepaalde objecten beter herkennen dan andere. ImageNet is niet perfect, maar het legde wel de basis voor hoe AI vandaag naar de wereld kijkt.

FAQ

Veelgestelde vragen over ImageNet

De drie meest gestelde vragen over dit onderwerp, kort beantwoord.

Wat is ImageNet?

Een gigantische database met miljoenen gelabelde foto's, die jarenlang de standaard was om te testen hoe goed AI-systemen plaatjes kunnen herkennen.

Waarom is ImageNet belangrijk?

ImageNet is een enorme verzameling van meer dan 14 miljoen foto's, allemaal keurig gelabeld met wat erop staat. Denk aan foto's van katten, auto's, bloemen, gereedschap — verdeeld over ruim 20.000 categorieën. Onderzoekers van Stanford hebben deze database vanaf 2009 opgebouwd, met als doel: een soort 'woordenboek in beelden' maken waarmee AI-systemen kunnen leren zien.

Hoe wordt ImageNet toegepast?

De database werd beroemd door de ImageNet Large Scale Visual Recognition Challenge, een jaarlijkse wedstrijd van 2010 tot 2017. Onderzoeksteams uit de hele wereld probeerden wie het beste AI-model kon bouwen om objecten op foto's te herkennen. Stel je voor: je krijgt een foto van een golden retriever, en de AI moet zo precies mogelijk zeggen wat het is.

Deel: