Wat is Capsule Network?
Een neuraal netwerk dat niet alleen herkent wát er in een plaatje staat, maar ook hóe dingen ten opzichte van elkaar staan — zodat een gezicht ondersteboven nog steeds een gezicht is.

Wat is een Capsule Network?
Een Capsule Network (ook wel CapsNet genoemd) is een bijzondere soort neuraal netwerk dat anders naar plaatjes kijkt dan traditionele modellen. Waar een gewoon AI-model vooral patronen herkent ("hier zie ik een oog, daar een neus"), snapt een Capsule Network ook de relatie tussen die onderdelen. Het begrijpt dat een neus tussen twee ogen hoort te zitten, niet ernaast of erop.
Stel je voor: een kleuter die net gezichten leert tekenen, zet soms een neus boven de ogen. Jij ziet meteen dat het niet klopt. Een gewoon AI-model ziet: "oog, oog, neus — check, dit is een gezicht!" Een Capsule Network ziet: "wacht, de positie klopt niet — dit is geen normaal gezicht."
Die gevoeligheid voor ruimtelijke verhoudingen maakt CapsNets bijzonder goed in situaties waar objecten gedraaid, verkleind of vervormd zijn.
Hoe werkt het eigenlijk?
In een traditioneel neuraal netwerk werken losse "neuronen" die ieder een klein detail herkennen — een randje, een kleur, een ronding. Die informatie wordt doorgestuurd naar hogere lagen, maar onderweg raakt veel ruimtelijke informatie verloren. Het heet "pooling": het netwerk gooit details weg om efficiënter te worden, maar verliest daarbij ook de precieze plek en oriëntatie van dingen.
Een Capsule Network werkt met "capsules" — groepjes neuronen die samen één concept vertegenwoordigen. Zo'n capsule herkent niet alleen "dit is een oor", maar slaat ook op: "dit oor staat onder een hoek van 30 graden, is 20% van het plaatje groot, en bevindt zich linksboven."
Die capsules praten met elkaar via een slim mechanisme dat "dynamic routing" heet. Stel: een capsule in laag 1 ziet iets dat lijkt op een oog. Die stuurt een signaal naar capsules in laag 2: "ik denk dat er hier een gezicht is." Als meerdere capsules (oog-links, oog-rechts, neus, mond) allemaal naar dezelfde gezicht-capsule wijzen én hun posities kloppen, dan wordt die gezicht-capsule geactiveerd. Kloppen de posities niet? Dan gebeurt er niks.
Het is alsof meerdere getuigen een verhaal vertellen: alleen als hun verklaringen consistent zijn, wordt het verhaal geloofd.
Waarom zou jij hier iets aan hebben?
Capsule Networks zijn vooral interessant voor toepassingen waar ruimtelijke precisie cruciaal is:
Medische beeldherkenning — een tumor die iets gedraaid of vervormd is, moet nog steeds herkend worden
Robotica en autonoom rijden — begrijpen hoe objecten in 3D-ruimte ten opzichte van elkaar staan
Gezichtsherkenning onder moeilijke omstandigheden — een gezicht vanaf de zijkant of gedeeltelijk verborgen blijft herkenbaar
Design en 3D-modellering — AI die begrijpt hoe vormen in elkaar passen en kunnen roteren
Het grote voordeel: CapsNets hebben vaak minder trainingsdata nodig om goed te worden in het herkennen van objecten vanuit verschillende hoeken. Een gewoon netwerk moet duizenden voorbeelden zien van een stoel van voren, van achteren, van opzij. Een CapsNet leert uit één hoek al iets over de structuur, en kan dat toepassen op andere standpunten.
Het nadeel: ze zijn rekenintensief en trager dan moderne convolutionele netwerken. Daarom zie je ze nog niet overal.
Waar kom je het tegen?
Capsule Networks zijn nog relatief nieuw (het concept werd in 2017 populair door een paper van Geoffrey Hinton en zijn team). Je vindt ze vooral in onderzoeksomgevingen en experimenten:
Medische AI-systemen in ziekenhuizen die experimenteren met tumour-detectie of orgaansegmentatie
Academisch onderzoek op universiteiten en in AI-labs die zoeken naar alternatieven voor standaard deep learning
Proof-of-concepts bij autonome voertuigen die beter willen begrijpen hoe fietsers en auto's zich in 3D-ruimte gedragen
TensorFlow en PyTorch — open-source AI-frameworks waar je experimentele CapsNet-implementaties kunt vinden
In productie-omgevingen zie je ze minder vaak dan bijvoorbeeld Transformers of standaard convolutionele netwerken, simpelweg omdat die sneller en bewezen effectief zijn voor de meeste taken. Maar zodra ruimtelijk begrip belangrijker wordt — denk aan augmented reality of robotica — kunnen CapsNets weer opduiken.
Een voorbeeld uit de praktijk
Stel: een AI moet handgeschreven cijfers lezen (zoals op cheques of adreslabels). Een gewoon netwerk traint op duizenden voorbeelden en leert: "deze pixelpatronen = een 7." Maar schrijf je die 7 met een streepje erdoor (zoals in veel Europese landen), of iets schuin, dan raakt het netwerk in de war.
Een Capsule Network leert niet alleen hoe een 7 eruitziet, maar ook de onderdelen: een verticale lijn met bovenaan een horizontaal streepje, onder een specifieke hoek. Zie je die onderdelen in een andere configuratie? Dan herkent het nog steeds een 7, ook al ziet het er anders uit dan in de trainingsdata.
In experimenten bleek dat CapsNets met minder voorbeelden betere resultaten haalden op vervormde of gedraaide cijfers dan traditionele netwerken — precies omdat ze begrijpen hoe een cijfer in elkaar zit, niet alleen wat de pixels zijn.
Capsule Networks zijn een fascinerende richting in AI-onderzoek — ze laten zien dat er alternatieven zijn voor de standaard aanpak. Als jij met AI werkt in een veld waar objecten vaak gedraaid, vervormd of gedeeltelijk verborgen zijn (medisch, robotica, 3D), is het de moeite waard om te volgen hoe deze technologie zich ontwikkelt. Misschien wordt het over een paar jaar de nieuwe standaard voor visuele intelligentie.
Veelgestelde vragen over Capsule Network
De drie meest gestelde vragen over dit onderwerp, kort beantwoord.
Wat is Capsule Network?
Een neuraal netwerk dat niet alleen herkent wát er in een plaatje staat, maar ook hóe dingen ten opzichte van elkaar staan — zodat een gezicht ondersteboven nog steeds een gezicht is.
Waarom is Capsule Network belangrijk?
Een Capsule Network (ook wel CapsNet genoemd) is een bijzondere soort neuraal netwerk dat anders naar plaatjes kijkt dan traditionele modellen. Waar een gewoon AI-model vooral patronen herkent ("hier zie ik een oog, daar een neus"), snapt een Capsule Network ook de relatie tussen die onderdelen. Het begrijpt dat een neus tussen twee ogen hoort te zitten, niet ernaast of erop.
Hoe wordt Capsule Network toegepast?
Stel je voor: een kleuter die net gezichten leert tekenen, zet soms een neus boven de ogen. Jij ziet meteen dat het niet klopt. Een gewoon AI-model ziet: "oog, oog, neus — check, dit is een gezicht!" Een Capsule Network ziet: "wacht, de positie klopt niet — dit is geen normaal gezicht."