Wat is NDCG?
Een metriek die meet hoe goed een AI-systeem zoekresultaten of aanbevelingen op volgorde zet — waarbij de beste items bovenaan het belangrijkst zijn.

Wat is NDCG eigenlijk?
Stel je voor: je zoekt op Google naar "beste koffiebar Amsterdam" en krijgt tien resultaten. De allereerste is fantastisch, de tweede is okee, de derde is matig. Nu vraag je je af: hoe goed deed Google het? NDCG — Normalized Discounted Cumulative Gain — is de manier om dat te meten.
Het idee is simpel: de volgorde van resultaten telt mee. Een perfect resultaat op plek 1 is waardevoller dan datzelfde resultaat op plek 5. NDCG geeft een score tussen 0 en 1, waarbij 1 betekent: "de beste items staan precies in de juiste volgorde bovenaan".
De naam klinkt intimiderend, maar het principe is logisch:
Cumulative Gain: tel de kwaliteit van alle resultaten bij elkaar op
Discounted: hoe verder naar beneden, hoe minder het meetelt (logaritmisch aflopend)
Normalized: schaal het naar een score tussen 0 en 1, zodat je verschillende lijsten kunt vergelijken
Hoe werkt het eigenlijk?
Je begint met een lijst resultaten. Elk resultaat krijgt een relevantiescore — bijvoorbeeld van 0 (totaal irrelevant) tot 3 (perfect relevant). Die scores tel je op, maar met een twist: resultaten lager in de lijst worden "afgeprijsd" door te delen door de logaritme van hun positie.
Daarna vergelijk je deze score met de ideale situatie — wat als je alle resultaten in perfecte volgorde had gezet? Die verhouding is je NDCG.
Een voorbeeld: stel je hebt vijf koffiebars, en de relevantie is 3, 2, 1, 0, 1. Ideaal zou de volgorde zijn: 3, 2, 1, 1, 0. NDCG meet hoe dicht je huidige volgorde bij dat ideaal zit.
Hoe hoger de NDCG, hoe beter je systeem de gebruiker helpt — want de beste antwoorden staan bovenaan, waar mensen ze daadwerkelijk zien.
Waarom zou jij hier iets aan hebben?
NDCG is overal waar AI iets moet rangschikken:
Zoekmachines: Google, Bing, interne bedrijfszoekmachines
Aanbevelingssystemen: Netflix die films sorteert, Spotify die playlists samenstelt, webshops die producten tonen
AI-assistenten: welk antwoord komt bovenaan in een chatbot?
Recruitment-tools: welke kandidaat staat bovenaan de longlist?
Voor AI-ontwikkelaars is NDCG cruciaal omdat het niet alleen meet óf je de juiste dingen vindt, maar ook of je ze in de juiste volgorde presenteert. Een systeem dat alle relevante resultaten vindt maar ze door elkaar gooit, scoort lager dan een systeem dat meteen de beste bovenaan zet.
Waar kom je het tegen?
NDCG wordt vooral gebruikt in de evaluatie van information retrieval-systemen:
Zoekalgoritmes: bij het trainen van Elasticsearch, Solr, of eigen zoekmachines
Recommender systems: bij het testen of Netflix-achtige aanbevelingen kloppen
RAG-systemen (Retrieval-Augmented Generation): meet of de AI de beste context-documenten vindt voor een antwoord
E-commerce: webshops die productaanbevelingen optimaliseren
Academic benchmarks: papers over information retrieval rapporteren bijna altijd NDCG-scores
In de praktijk zie je vaak NDCG@10 of NDCG@5 — dat betekent: meet alleen de top-10 of top-5 resultaten, want niemand kijkt toch verder.
Wat kun je ermee?
Als je een zoek- of aanbevelingssysteem bouwt, gebruik je NDCG om te testen of wijzigingen echt verbetering opleveren. Stel je past je algoritme aan — stijgt de NDCG? Dan helpt het. Daalt de score? Dan maak je het juist slechter.
Voor niet-techneuten: als je ooit feedback geeft op slechte zoekresultaten ("waarom staat dit bovenaan?"), dan evalueer je in feite wat NDCG meet. Het is de metriek die ervoor zorgt dat AI-systemen leren wat jij als "goede volgorde" ervaart — zodat de beste antwoorden niet ergens op pagina 3 verstopt zitten, maar meteen zichtbaar zijn waar je ze nodig hebt.
Veelgestelde vragen over NDCG
De drie meest gestelde vragen over dit onderwerp, kort beantwoord.
Wat is NDCG?
Een metriek die meet hoe goed een AI-systeem zoekresultaten of aanbevelingen op volgorde zet — waarbij de beste items bovenaan het belangrijkst zijn.
Waarom is NDCG belangrijk?
Stel je voor: je zoekt op Google naar "beste koffiebar Amsterdam" en krijgt tien resultaten. De allereerste is fantastisch, de tweede is okee, de derde is matig. Nu vraag je je af: hoe goed deed Google het? NDCG — Normalized Discounted Cumulative Gain — is de manier om dat te meten.
Hoe wordt NDCG toegepast?
Het idee is simpel: de volgorde van resultaten telt mee. Een perfect resultaat op plek 1 is waardevoller dan datzelfde resultaat op plek 5. NDCG geeft een score tussen 0 en 1, waarbij 1 betekent: "de beste items staan precies in de juiste volgorde bovenaan".