Wat is Bernoulli Distribution?
Een kansverdeling voor ja/nee-uitkomsten, zoals munt opgooien of spam/niet-spam: precies twee mogelijkheden, elk met een eigen kans.

Wat is een Bernoulli Distribution eigenlijk?
Stel je voor: je gooit een munt op. Kop of munt. Twee mogelijkheden, meer niet. Of je krijgt een e-mail binnen: spam of niet-spam. Klik of geen klik op een advertentie. Geslaagd of gezakt. Een patiënt herstelt of niet. Al deze situaties hebben één ding gemeen: er zijn precies twee uitkomsten, en je wilt weten hoe groot de kans op elk ervan is.
Dat is precies wat een Bernoulli Distribution beschrijft. Het is een eenvoudig wiskundig model dat zegt: "Er zijn twee mogelijkheden — laten we ze 'succes' en 'mislukking' noemen — en de kans op succes is p. De kans op mislukking is dan automatisch 1 minus p." Simpel, maar ongelooflijk krachtig.
De Bernoulli Distribution is vernoemd naar de Zwitserse wiskundige Jakob Bernoulli (1655-1705). Hij bedacht dit model om kansspelletjes te begrijpen, maar tegenwoordig zie je het overal in AI: van spam-detectie tot aanbevelingssystemen.
Hoe werkt het in de praktijk?
Zeg dat je een AI-model bouwt dat voorspelt of iemand op een advertentie klikt. Voor elke gebruiker krijg je één voorspelling: klik (1) of geen klik (0). Dat is een Bernoulli-uitkomst.
Je model leert een kans p voor elke gebruiker. Bijvoorbeeld: "Deze persoon heeft 23% kans om te klikken." Dat getal komt uit een Bernoulli Distribution. Het model traint op duizenden voorbeelden van mensen die wel of niet klikten, en leert zo de patronen herkennen die leiden tot die kansen.
Een ander voorbeeld: spam-detectie. Een nieuw bericht komt binnen. Je model geeft een uitkomst: spam (1) of niet-spam (0). Intern gebruikt het vaak een Bernoulli-aanname: "Gegeven deze woorden en patronen, wat is de kans dat dit spam is?"
De kracht zit 'm in de eenvoud: in plaats van ingewikkelde scenario's, reduceer je alles tot één essentiële vraag met twee antwoorden. Dat maakt modellen sneller en gemakkelijker te trainen.
Waarom is dit belangrijk voor AI?
Veel AI-taken zijn in de kern classificatieproblemen: is dit een kat of geen kat? Frauduleuze transactie of niet? Relevant zoekresultaat of niet? Bij al deze vragen gebruik je (vaak onbewust) het principe van de Bernoulli Distribution.
In logistische regressie — een veelgebruikte techniek in Machine Learning — ga je ervan uit dat de uitkomst Bernoulli-verdeeld is. Je model leert niet een exacte ja/nee, maar een kans tussen 0 en 1. Die kans is de p uit de Bernoulli Distribution.
Ook in neural networks zie je het terug. De laatste laag gebruikt vaak een sigmoid-functie die een getal tussen 0 en 1 produceert — dat is je Bernoulli-kans. Het netwerk leert: "Gegeven deze input, hoe waarschijnlijk is uitkomst 1?"
Waar kom je het tegen?
Je ziet Bernoulli Distributions in actie bij:
Spam-filters (Gmail, Outlook) — elk bericht krijgt een ja/nee-classificatie
Klikvoorspellingen in advertentieplatforms (Google Ads, Meta Ads) — wel of niet klikken
Fraudedetectie bij banken — transactie verdacht of niet
Medische diagnostiek-AI — ziekte aanwezig of afwezig
A/B-testen in webshops — conversie of geen conversie
Recommender systems — item relevant of niet voor deze gebruiker
Elk AI-model dat een binaire keuze maakt, gebruikt onder de motorkap vaak een vorm van Bernoulli-logica. Het is de bouwsteen voor complexere modellen.
Wat kun je ermee?
Als je begrijpt hoe Bernoulli Distributions werken, snap je beter hoe AI-modellen keuzes maken — en waar ze fout kunnen gaan. Een model dat zegt "95% kans op spam" klinkt zeker, maar die 95% is gebaseerd op patronen in trainingsdata. Als die data scheef is (bijvoorbeeld: vooral Engelstalige spam), dan klopt die kans misschien niet voor Nederlandstalige berichten.
Ook helpt het bij het interpreteren van model-output. Als een model "0,51" teruggeeft (net boven de helft), weet je: dit is een grensgevalgeval, niet een duidelijke keuze. Dat kan belangrijk zijn bij beslissingen met grote impact, zoals medische diagnoses of kredietaanvragen.
Voor wie zelf met data werkt: begrijpen dat veel AI-problemen terug te brengen zijn tot Bernoulli-achtige vragen, helpt je modellen simpeler en effectiever te maken. Begin met de basis: wat zijn mijn twee uitkomsten? Wat is de kans op elk? Bouw daarop verder.
Veelgestelde vragen over Bernoulli Distribution
De drie meest gestelde vragen over dit onderwerp, kort beantwoord.
Wat is Bernoulli Distribution?
Een kansverdeling voor ja/nee-uitkomsten, zoals munt opgooien of spam/niet-spam: precies twee mogelijkheden, elk met een eigen kans.
Waarom is Bernoulli Distribution belangrijk?
Stel je voor: je gooit een munt op. Kop of munt. Twee mogelijkheden, meer niet. Of je krijgt een e-mail binnen: spam of niet-spam. Klik of geen klik op een advertentie. Geslaagd of gezakt. Een patiënt herstelt of niet. Al deze situaties hebben één ding gemeen: er zijn precies twee uitkomsten, en je wilt weten hoe groot de kans op elk ervan is.
Hoe wordt Bernoulli Distribution toegepast?
Dat is precies wat een Bernoulli Distribution beschrijft. Het is een eenvoudig wiskundig model dat zegt: "Er zijn twee mogelijkheden — laten we ze 'succes' en 'mislukking' noemen — en de kans op succes is p. De kans op mislukking is dan automatisch 1 minus p." Simpel, maar ongelooflijk krachtig.