Alle termenData, evaluatie & metrics

Wat is Davies-Bouldin Index?

Een getal dat aangeeft hoe goed een clustering-algoritme data in groepen heeft verdeeld — hoe lager de score, hoe beter gescheiden de clusters zijn.

Wat is de Davies-Bouldin Index?

Stel je voor dat je duizenden klanten wilt indelen in groepen — bijvoorbeeld 'prijsbewuste shoppers', 'impulskopers' en 'merkliefhebbers'. Een clustering-algoritme doet dat automatisch, maar hoe weet je of die groepen écht zinvol zijn? Daar komt de Davies-Bouldin Index om de hoek kijken.

De Davies-Bouldin Index is een meetmethode die berekent hoe goed clustering-algoritmes hun werk hebben gedaan. Het geeft één getal terug: hoe lager die score, hoe beter de clusters gescheiden zijn. Een lage score betekent dat punten binnen een cluster dicht bij elkaar zitten, en clusters onderling ver uit elkaar staan — precies wat je wilt.

Hoe werkt het eigenlijk?

De index kijkt naar twee dingen tegelijk:

Binnen-cluster spreiding — hoe ver zitten de punten in één cluster van hun middelpunt? Een goede cluster is compact, zoals een dichte wolk.
Tussen-cluster afstand — hoe ver staan de middelpunten van verschillende clusters van elkaar? Goede clusters liggen ver uit elkaar, zoals aparte eilanden.

Voor elk cluster berekent de Davies-Bouldin Index de verhouding tussen deze twee. Vervolgens neemt het de slechtste (hoogste) verhouding van elk cluster en middelt die. Dat klinkt abstract, maar denk er zo over: als twee clusters elkaar overlappen (zoals wanneer 'impulskopers' en 'merkliefhebbers' door elkaar lopen), dan springt de score omhoog. Als ze netjes gescheiden zijn, blijft de score laag.

Het mooie: je hebt geen labels nodig. Bij supervised learning weet je van tevoren wat de juiste antwoorden zijn, maar bij clustering niet — daar ontdek je de groepen juist. De Davies-Bouldin Index werkt puur op basis van de posities van datapunten.

Waarom zou jij hier iets aan hebben?

Als je met clustering werkt — bijvoorbeeld om klanten te segmenteren, patronen in data te ontdekken of anomalieën op te sporen — dan wil je weten of je algoritme zinnige groepen maakt. De Davies-Bouldin Index helpt je objectief vergelijken:

Verschillende algoritmes testen — K-means versus DBSCAN: welke maakt betere clusters in jouw dataset?
Het juiste aantal clusters kiezen — probeer 3, 5 of 7 clusters en bekijk welke score het laagst is.
Hyperparameters tunen — pas instellingen aan en check of de clustering-kwaliteit verbetert.

Een praktijkvoorbeeld: een webshop clustert bezoekersgedrag om gepersonaliseerde aanbiedingen te maken. Met drie clusters krijgen ze een Davies-Bouldin Index van 1,8. Met vijf clusters daalt die naar 0,9 — dat suggereert dat vijf groepen een scherpere segmentatie geven. Zo maak je een onderbouwde keuze in plaats van te gokken.

Waar kom je het tegen?

De Davies-Bouldin Index zit in bijna elke data science toolkit:

Python: scikit-learn heeft davies_bouldin_score() standaard ingebouwd
R: packages zoals clv en cluster bieden deze metric aan
KNIME, RapidMiner, Orange: visuele data science-tools tonen de score automatisch bij clustering-nodes
Cloud-platformen: Azure Machine Learning, Google Vertex AI en AWS SageMaker ondersteunen de index in hun clustering-pipelines

Je vindt het terug in branches waar segmentatie essentieel is: marketing (klantsegmenten), zorg (patiëntengroepen), finance (risicoprofielen), retail (product-clustering) en cybersecurity (anomalie-detectie).

Even opletten

De Davies-Bouldin Index heeft beperkingen. Het werkt het best bij bolvormige clusters (zoals K-means die maakt), maar worstelt met rare vormen — denk aan een halve maan of een donut-vorm. Ook houdt het geen rekening met dichtheid: een cluster kan compact lijken terwijl het eigenlijk meerdere subgroepjes bevat.

Daarom gebruik je deze metric meestal niet alleen, maar naast andere zoals de Silhouette Score of Calinski-Harabasz Index. Samen geven ze een completer beeld.

Wat kun je er nu mee?

Als je binnenkort met clustering aan de slag gaat, voeg de Davies-Bouldin Index toe aan je evaluatie. Test meerdere aantallen clusters, vergelijk de scores en kies de configuratie met de laagste waarde — mits het aantal clusters ook inhoudelijk logisch is voor jouw probleem. Zo maak je van een zwarte doos een transparant proces, en kun je met vertrouwen zeggen: dit zijn de groepen die echt in onze data zitten.

FAQ

Veelgestelde vragen over Davies-Bouldin Index

De drie meest gestelde vragen over dit onderwerp, kort beantwoord.

Wat is Davies-Bouldin Index?

Een getal dat aangeeft hoe goed een clustering-algoritme data in groepen heeft verdeeld — hoe lager de score, hoe beter gescheiden de clusters zijn.

Waarom is Davies-Bouldin Index belangrijk?

Hoe wordt Davies-Bouldin Index toegepast?

Deel:

Laatst bijgewerkt 3 mei 2026