Direct naar inhoud
Alle termenWiskundige & statistische basis

Wat is Likelihood?

De kans dat je observaties kloppen gegeven een bepaald model — de basis voor hoe AI-systemen leren van data door te kijken welke verklaring het meest waarschijnlijk is.

Wat is Likelihood

Wat is likelihood eigenlijk?

Stel je voor: je hoort 's nachts een harde bons in huis. Wat is er gebeurd? Misschien is de kat van tafel gevallen. Misschien is er iets omgewaaid. Of misschien is er ingebroken. Je hebt verschillende verklaringen (modellen), en je weegt af: welke verklaart het best wat ik net hoorde?

Dat is precies wat likelihood doet in AI. Het is een maat die aangeeft: gegeven een bepaalde verklaring of model, hoe waarschijnlijk is het dat ik precies deze data zou zien? Als je model zegt "de kat valt gemiddeld één keer per week", en je hebt in drie maanden vijftig bonzen gehoord, dan is de likelihood van dat model erg laag. Dat model verklaart je observaties niet goed.

In formele taal: likelihood meet de waarschijnlijkheid van je data, gegeven de parameters van je model. Maar vergeet die definitie gerust — denk aan de kat.

Hoe werkt het in AI?

AI-modellen leren door te zoeken naar de beste verklaring voor trainingsdata. Ze passen hun interne instellingen (parameters) aan totdat de likelihood maximaal is — oftewel: totdat het model de beste verklaring biedt voor wat het heeft gezien.

Een voorbeeld: je traint een spamfilter. Het model ziet duizenden emails en leert: "emails met het woord 'gratis' zijn vaak spam". De likelihood helpt het model inschatten: gegeven deze regel, hoe goed verklaar ik alle emails die ik heb gezien? Als de regel goed werkt, stijgt de likelihood. Zo past het model zich steeds verder aan.

Bij taalmodellen zoals die achter chatbots zitten, werkt het net zo. Het model leert: gegeven alle tekst die ik heb gezien, wat is de meest waarschijnlijke volgende zin? Het woord met de hoogste likelihood wordt gekozen. Daarom voelen AI-antwoorden vaak logisch — ze zijn letterlijk geoptimaliseerd om waarschijnlijk te klinken op basis van miljoenen voorbeelden.

Likelihood vs. kans — waar zit het verschil?

Dit verwaart mensen vaak: likelihood lijkt op kans, maar het is net andersom.

  • Kans: gegeven een model, hoe waarschijnlijk is een toekomstige gebeurtenis? ("Als ik een dobbelsteen gooi, wat is de kans op een zes?")

  • Likelihood: gegeven data die ik al heb gezien, hoe waarschijnlijk is dit model? ("Ik heb tien keer gegooid en tien keer zes gehad — hoe waarschijnlijk is het dat deze dobbelsteen eerlijk is?")

Kans kijkt vooruit, likelihood kijkt terug. In AI gebruik je likelihood om modellen te trainen: je hebt data, en je zoekt het model dat die data het best verklaart.

Waar kom je het tegen?

Je ziet likelihood overal waar AI iets leert van data:

  • Aanbevelingssystemen (Netflix, Spotify): welke voorkeuren verklaren het best wat jij hebt gekeken of geluisterd?

  • Chatbots en taalmodellen (ChatGPT, Claude, Gemini, Copilot): welk woord is het meest waarschijnlijk gegeven de context?

  • Spam- en fraudedetectie: welk patroon verklaart het best dat deze transactie verdacht is?

  • Medische diagnostiek-AI: gegeven deze symptomen, welke diagnose heeft de hoogste likelihood?

  • Zelfrijdende auto's: gegeven wat de sensoren zien, welke interpretatie ("voetganger steekt over" vs. "schaduw") is het meest waarschijnlijk?

In machine learning-frameworks (TensorFlow, PyTorch, scikit-learn) zit likelihood in vrijwel elke trainingsprocedure — vaak onder de motorkap als "loss function" of "negative log-likelihood".

Waarom is dit belangrijk voor jou?

Als je begrijpt dat AI-systemen werken door likelihood te maximaliseren, snap je ook hun beperkingen. Ze kiezen wat statistisch waarschijnlijk is — niet per se wat waar, origineel of ethisch verantwoord is. Een taalmodel kan met hoge likelihood een aannemelijk klinkend maar volledig verzonnen feit genereren, simpelweg omdat die zinsbouw vaak voorkomt in de trainingsdata.

Dat verklaart ook waarom AI soms vooroordelen reproduceert: als bepaalde associaties vaak voorkomen in de data, krijgen ze hoge likelihood — ook al zijn ze problematisch. Likelihood is een krachtig leermechanisme, maar het onderscheidt niet automatisch tussen "komt vaak voor" en "is goed".

Als je met AI-tools werkt, helpt het om te weten: het systeem geeft je het meest waarschijnlijke antwoord, niet per se het juiste. Dat maakt kritisch meelezen en fact-checking essentieel — zeker bij belangrijke beslissingen.

FAQ

Veelgestelde vragen over Likelihood

De drie meest gestelde vragen over dit onderwerp, kort beantwoord.

Wat is Likelihood?

De kans dat je observaties kloppen gegeven een bepaald model — de basis voor hoe AI-systemen leren van data door te kijken welke verklaring het meest waarschijnlijk is.

Waarom is Likelihood belangrijk?

Stel je voor: je hoort 's nachts een harde bons in huis. Wat is er gebeurd? Misschien is de kat van tafel gevallen. Misschien is er iets omgewaaid. Of misschien is er ingebroken. Je hebt verschillende verklaringen (modellen), en je weegt af: welke verklaart het best wat ik net hoorde?

Hoe wordt Likelihood toegepast?

Dat is precies wat likelihood doet in AI. Het is een maat die aangeeft: gegeven een bepaalde verklaring of model, hoe waarschijnlijk is het dat ik precies deze data zou zien? Als je model zegt "de kat valt gemiddeld één keer per week", en je hebt in drie maanden vijftig bonzen gehoord, dan is de likelihood van dat model erg laag. Dat model verklaart je observaties niet goed.

Deel: