Direct naar inhoud
Alle termenData, evaluatie & metrics

Wat is ROC Curve?

Een grafiek die laat zien hoe goed een AI-model onderscheid maakt tussen twee groepen — bijvoorbeeld wel-spam en geen-spam — door te kijken naar de balans tussen juiste en foute alarmen.

Wat is ROC Curve

Wat is een ROC Curve eigenlijk?

Stel je voor: je bouwt een spamfilter. Die moet beslissen: is dit bericht spam of niet? Nu kun je de filter streng instellen (bijna alles blokkeren) of juist soepel (bijna alles doorlaten). Bij een strenge instelling catch je wel veel spam, maar ook echte e-mails belanden in je spammap. Bij een soepele instelling laat je meer spam door, maar mis je minder echte berichten.

Een ROC Curve (Receiver Operating Characteristic Curve) is een grafiek die precies dit dilemma visualiseert. Hij laat zien hoe je model presteert bij verschillende "gevoeligheidsinstellingen". Op de verticale as staat het percentage échte positieven dat je correct identificeert (de spam die je daadwerkelijk vangt). Op de horizontale as staat het percentage fout alarm (goede e-mails die je per ongeluk als spam markeert).

Hoe dichter de lijn bij de linkerbovenhoek komt, hoe beter: dan vang je veel spam zonder veel fouten te maken. Een perfecte ROC Curve zou een rechte hoek zijn — vanaf de linkeronderhoek naar linksboven, dan rechtdoor naar rechtsboven. Een nutteloos model — eentje dat gewoon random gokt — geeft een diagonale lijn van linksonder naar rechtsboven.

Waar gebruik je het voor?

De ROC Curve helpt je bij het kiezen van de juiste drempelwaarde voor je model. Stel, je model geeft een score tussen 0 en 1 voor "waarschijnlijkheid van spam". Vanaf welke score noem je het spam? 0,5? 0,7? De ROC Curve laat zien wat er gebeurt bij élke mogelijke drempel.

Daarnaast kun je ermee modellen vergelijken. Model A heeft een curve die verder naar links buigt dan model B? Dan is A beter in staat om onderscheid te maken. Vaak wordt dit samengevat in één getal: de AUC (Area Under the Curve) — het oppervlak onder de ROC Curve. Een AUC van 1,0 is perfect, 0,5 is gokken, alles ertussenin zegt iets over de kwaliteit van je classificatie.

Een voorbeeld uit de praktijk

Een ziekenhuis gebruikt AI om op röntgenfoto's te voorspellen of iemand longkanker heeft. Hier is de trade-off cruciaal:

  • Te gevoelig: veel patiënten krijgen een vals alarm, onnodige stress en vervolgonderzoeken

  • Te weinig gevoelig: je mist daadwerkelijke kankergevallen, met levensbedreigende gevolgen

De ROC Curve helpt artsen en data scientists om de drempel te kiezen die past bij hun prioriteit. Wil je vooral niemand missen (hoge "recall")? Dan accepteer je meer valse alarmen. Wil je vooral geen onnodige angst veroorzaken (hoge "precision")? Dan mis je misschien meer subtiele gevallen. De curve maakt deze keuze transparant.

Waar kom je het tegen?

  • Machine learning-platforms zoals Scikit-learn, TensorFlow en PyTorch genereren standaard ROC Curves tijdens modeltraining

  • Medische AI-tools voor diagnostiek (kankerdetectie, hartritmestoornissen) gebruiken ROC Curves om veilige drempelwaarden te bepalen

  • Fraudedetectiesystemen bij banken en verzekeringsmaatschappijen evalueren hun modellen met ROC Curves

  • Marketing automation zoals klantchurn-voorspelling of lead scoring — waar je wilt weten wie waarschijnlijk vertrekt of koopt

  • Recruitment-AI die cv's screent, moet balanceren tussen het missen van goede kandidaten en het doorsluizen van ongeschikte profielen

Waarom zou jij hier iets aan hebben?

Als je werkt met AI-modellen die een ja/nee-beslissing moeten nemen, helpt de ROC Curve je om bewust te kiezen waar je prioriteit ligt. Geen enkel model is perfect — er is altijd een afweging tussen gemiste kansen en foute alarmen. Door de curve te bekijken, begrijp je die trade-off en kun je een instelling kiezen die past bij jouw context.

Voor niet-techneuten is het vooral belangrijk om te weten: als iemand zegt "ons model heeft een AUC van 0,92", dan weet je dat het een sterke voorspeller is. Alles boven 0,8 is meestal bruikbaar, tussen 0,7-0,8 redelijk, en onder 0,7 vaak te zwak voor serieuze toepassingen. Maar ook dat hangt af van de situatie — bij levensbedreigende beslissingen wil je hoger, bij marketing-experimenten kun je meer risico nemen.

FAQ

Veelgestelde vragen over ROC Curve

De drie meest gestelde vragen over dit onderwerp, kort beantwoord.

Wat is ROC Curve?

Een grafiek die laat zien hoe goed een AI-model onderscheid maakt tussen twee groepen — bijvoorbeeld wel-spam en geen-spam — door te kijken naar de balans tussen juiste en foute alarmen.

Waarom is ROC Curve belangrijk?

Stel je voor: je bouwt een spamfilter. Die moet beslissen: is dit bericht spam of niet? Nu kun je de filter streng instellen (bijna alles blokkeren) of juist soepel (bijna alles doorlaten). Bij een strenge instelling catch je wel veel spam, maar ook echte e-mails belanden in je spammap. Bij een soepele instelling laat je meer spam door, maar mis je minder echte berichten.

Hoe wordt ROC Curve toegepast?

Een ROC Curve (Receiver Operating Characteristic Curve) is een grafiek die precies dit dilemma visualiseert. Hij laat zien hoe je model presteert bij verschillende "gevoeligheidsinstellingen". Op de verticale as staat het percentage échte positieven dat je correct identificeert (de spam die je daadwerkelijk vangt). Op de horizontale as staat het percentage fout alarm (goede e-mails die je per ongeluk als spam markeert).

Deel: