Alle termenData, evaluatie & metrics

Wat is Log Loss?

Een manier om te meten hoe zeker een AI-model is van zijn voorspellingen — hoe lager de score, hoe betrouwbaarder de kansen die het geeft.

Wat is Log Loss eigenlijk?

Stel je voor: je vraagt een AI of een e-mail spam is. Het antwoord is niet alleen "ja" of "nee", maar "85% zeker dat het spam is". Log Loss meet hoe goed die zekerheidspercentages kloppen. Als het model zegt "95% zeker" en het klopt inderdaad, dan scoort het goed. Maar zegt het "95% zeker" terwijl het fout zit? Dan stijgt de Log Loss-score flink.

De term staat voor "logarithmic loss" — een wiskundige methode die niet alleen kijkt óf een model goed of fout zit, maar ook hoe zeker het was van zijn antwoord. Een model dat twijfelt ("55% kans op spam") krijgt een mildere straf bij een fout dan een model dat vol vertrouwen iets verkeerds roept.

Waarom is dat belangrijk?

Niet alle fouten zijn even erg. Stel: een zelfrijdende auto moet inschatten of een object op de weg een voetganger is. Als het systeem zegt "waarschijnlijk geen voetganger" maar het blijkt er wel een te zijn, is dat gevaarlijker dan wanneer het zegt "misschien wel, misschien niet" en dus voorzichtiger reageert.

Log Loss helpt ontwikkelaars modellen te trainen die niet alleen vaak goed zitten, maar ook weten wanneer ze twijfelen. Dat maakt AI-systemen betrouwbaarder in situaties waar nuance telt: medische diagnoses, kredietbeoordelingen, fraude-detectie.

De score werkt zo: hoe dichter bij 0, hoe beter. Een Log Loss van 0 zou betekenen dat het model altijd 100% zeker is en altijd gelijk heeft — in de praktijk onmogelijk. Scores boven de 1 duiden op een model dat stelselmatig te zeker is van verkeerde antwoorden.

Een voorbeeld uit de praktijk

Een webshop wil voorspellen welke klanten hun winkelmandje zullen afrekenen. Model A zegt bij 100 klanten: "allemaal 50% kans" — saai, maar veilig. Model B durft uitspraken aan: "deze 20 klanten: 90% kans, die 30: 10% kans". Als Model B z'n percentages goed heeft ingeschat, scoort het een veel lagere Log Loss dan Model A.

Dat betekent: de webshop kan gerichter korting aanbieden aan twijfelaars, en topklanten met rust laten. Het model geeft niet alleen een ja/nee, maar bruikbare zekerheidsgraden.

Waar kom je het tegen?

Log Loss is een standaard meetlat in machine learning-platforms. Je ziet het vaak bij:

Kaggle-wedstrijden (data science-competities waar teams AI-modellen bouwen)
Google Cloud AutoML en Amazon SageMaker (tonen Log Loss in evaluatierapporten)
Scikit-learn (Python-bibliotheek voor machine learning, met een log_loss-functie)
TensorFlow en PyTorch (frameworks waarin je tijdens training de Log Loss kunt volgen)
Marketing-tools die kopen-kansen voorspellen (Salesforce Einstein, HubSpot)

Je hoeft de term zelf niet te gebruiken — vaak staat er gewoon "model confidence" of "probability score" — maar achter de schermen wordt Log Loss gebruikt om te bepalen welk model het beste werkt.

Wat kun je er nu mee?

Als je zelf met AI-modellen werkt of rapporten leest van data scientists: let op de Log Loss-score. Een lage waarde (dichter bij 0) betekent dat het model niet alleen vaak goed zit, maar ook realistische kansen geeft. Dat is cruciaal als je op basis van die kansen beslissingen neemt — denk aan: wie krijgt een lening, welke patiënt heeft spoedzorg nodig, welke advertentie toon je aan wie.

En voor wie modellen laat bouwen: vraag niet alleen naar "hoe vaak zit het goed" (accuracy), maar ook naar "hoe betrouwbaar zijn de kansen die het geeft". Dat is waar Log Loss het antwoord op geeft.

FAQ

Veelgestelde vragen over Log Loss

De drie meest gestelde vragen over dit onderwerp, kort beantwoord.

Wat is Log Loss?

Een manier om te meten hoe zeker een AI-model is van zijn voorspellingen — hoe lager de score, hoe betrouwbaarder de kansen die het geeft.

Waarom is Log Loss belangrijk?

Hoe wordt Log Loss toegepast?

De term staat voor "logarithmic loss" — een wiskundige methode die niet alleen kijkt óf een model goed of fout zit, maar ook hoe zeker het was van zijn antwoord. Een model dat twijfelt ("55% kans op spam") krijgt een mildere straf bij een fout dan een model dat vol vertrouwen iets verkeerds roept.

Deel:

Laatst bijgewerkt 4 mei 2026