Wat is Davies-Bouldin Index?
Een getal dat aangeeft hoe goed een clustering-algoritme data in groepen heeft verdeeld — hoe lager de score, hoe beter gescheiden de clusters zijn.

Wat is de Davies-Bouldin Index?
Stel je voor dat je duizenden klanten wilt indelen in groepen — bijvoorbeeld 'prijsbewuste shoppers', 'impulskopers' en 'merkliefhebbers'. Een clustering-algoritme doet dat automatisch, maar hoe weet je of die groepen écht zinvol zijn? Daar komt de Davies-Bouldin Index om de hoek kijken.
De Davies-Bouldin Index is een meetmethode die berekent hoe goed clustering-algoritmes hun werk hebben gedaan. Het geeft één getal terug: hoe lager die score, hoe beter de clusters gescheiden zijn. Een lage score betekent dat punten binnen een cluster dicht bij elkaar zitten, en clusters onderling ver uit elkaar staan — precies wat je wilt.
Hoe werkt het eigenlijk?
De index kijkt naar twee dingen tegelijk:
Binnen-cluster spreiding — hoe ver zitten de punten in één cluster van hun middelpunt? Een goede cluster is compact, zoals een dichte wolk.
Tussen-cluster afstand — hoe ver staan de middelpunten van verschillende clusters van elkaar? Goede clusters liggen ver uit elkaar, zoals aparte eilanden.
Voor elk cluster berekent de Davies-Bouldin Index de verhouding tussen deze twee. Vervolgens neemt het de slechtste (hoogste) verhouding van elk cluster en middelt die. Dat klinkt abstract, maar denk er zo over: als twee clusters elkaar overlappen (zoals wanneer 'impulskopers' en 'merkliefhebbers' door elkaar lopen), dan springt de score omhoog. Als ze netjes gescheiden zijn, blijft de score laag.
Het mooie: je hebt geen labels nodig. Bij supervised learning weet je van tevoren wat de juiste antwoorden zijn, maar bij clustering niet — daar ontdek je de groepen juist. De Davies-Bouldin Index werkt puur op basis van de posities van datapunten.
Waarom zou jij hier iets aan hebben?
Als je met clustering werkt — bijvoorbeeld om klanten te segmenteren, patronen in data te ontdekken of anomalieën op te sporen — dan wil je weten of je algoritme zinnige groepen maakt. De Davies-Bouldin Index helpt je objectief vergelijken:
Verschillende algoritmes testen — K-means versus DBSCAN: welke maakt betere clusters in jouw dataset?
Het juiste aantal clusters kiezen — probeer 3, 5 of 7 clusters en bekijk welke score het laagst is.
Hyperparameters tunen — pas instellingen aan en check of de clustering-kwaliteit verbetert.
Een praktijkvoorbeeld: een webshop clustert bezoekersgedrag om gepersonaliseerde aanbiedingen te maken. Met drie clusters krijgen ze een Davies-Bouldin Index van 1,8. Met vijf clusters daalt die naar 0,9 — dat suggereert dat vijf groepen een scherpere segmentatie geven. Zo maak je een onderbouwde keuze in plaats van te gokken.
Waar kom je het tegen?
De Davies-Bouldin Index zit in bijna elke data science toolkit:
Python: scikit-learn heeft
davies_bouldin_score()standaard ingebouwdR: packages zoals
clvenclusterbieden deze metric aanKNIME, RapidMiner, Orange: visuele data science-tools tonen de score automatisch bij clustering-nodes
Cloud-platformen: Azure Machine Learning, Google Vertex AI en AWS SageMaker ondersteunen de index in hun clustering-pipelines
Je vindt het terug in branches waar segmentatie essentieel is: marketing (klantsegmenten), zorg (patiëntengroepen), finance (risicoprofielen), retail (product-clustering) en cybersecurity (anomalie-detectie).
Even opletten
De Davies-Bouldin Index heeft beperkingen. Het werkt het best bij bolvormige clusters (zoals K-means die maakt), maar worstelt met rare vormen — denk aan een halve maan of een donut-vorm. Ook houdt het geen rekening met dichtheid: een cluster kan compact lijken terwijl het eigenlijk meerdere subgroepjes bevat.
Daarom gebruik je deze metric meestal niet alleen, maar naast andere zoals de Silhouette Score of Calinski-Harabasz Index. Samen geven ze een completer beeld.
Wat kun je er nu mee?
Als je binnenkort met clustering aan de slag gaat, voeg de Davies-Bouldin Index toe aan je evaluatie. Test meerdere aantallen clusters, vergelijk de scores en kies de configuratie met de laagste waarde — mits het aantal clusters ook inhoudelijk logisch is voor jouw probleem. Zo maak je van een zwarte doos een transparant proces, en kun je met vertrouwen zeggen: dit zijn de groepen die echt in onze data zitten.
Veelgestelde vragen over Davies-Bouldin Index
De drie meest gestelde vragen over dit onderwerp, kort beantwoord.
Wat is Davies-Bouldin Index?
Een getal dat aangeeft hoe goed een clustering-algoritme data in groepen heeft verdeeld — hoe lager de score, hoe beter gescheiden de clusters zijn.
Waarom is Davies-Bouldin Index belangrijk?
Stel je voor dat je duizenden klanten wilt indelen in groepen — bijvoorbeeld 'prijsbewuste shoppers', 'impulskopers' en 'merkliefhebbers'. Een clustering-algoritme doet dat automatisch, maar hoe weet je of die groepen écht zinvol zijn? Daar komt de Davies-Bouldin Index om de hoek kijken.
Hoe wordt Davies-Bouldin Index toegepast?
De Davies-Bouldin Index is een meetmethode die berekent hoe goed clustering-algoritmes hun werk hebben gedaan. Het geeft één getal terug: hoe lager die score, hoe beter de clusters gescheiden zijn. Een lage score betekent dat punten binnen een cluster dicht bij elkaar zitten, en clusters onderling ver uit elkaar staan — precies wat je wilt.