Alle termenWiskundige & statistische basis

Wat is T-Test?

Een statistische test die checkt of het verschil tussen twee groepen echt is, of toevallig. Bijvoorbeeld: presteert jouw AI-model écht beter na een update, of leek het gewoon een gelukje?

Wat is een T-Test eigenlijk?

Stel je voor: je hebt twee versies van je chatbot getest. Versie A krijgt gemiddeld een klanttevredenheidsscore van 7,2. Versie B scoort 7,8. Mooi! Maar is dat verschil van 0,6 punten nou echt significant? Of had je gewoon toevallig een paar vriendelijkere klanten in groep B?

Dat is precies waar een T-Test voor dient. Het is een statistische methode die uitrekent of een verschil tussen twee groepen groot genoeg is om 'echt' te zijn — en niet gewoon toeval of ruis in je data.

In AI-land gebruik je dit voortdurend: bij het vergelijken van modelprestaties, het testen van nieuwe trainingmethoden, of het checken of een nieuwe feature daadwerkelijk beter werkt.

Hoe werkt het?

De T-Test kijkt naar drie dingen:

Het verschil tussen de gemiddelden — hoe ver liggen de twee groepen uit elkaar?
De spreiding in de data — hoeveel variatie zit er binnen elke groep? Als de scores alle kanten op schieten, is het moeilijker om te zeggen dat het verschil echt is.
De grootte van je steekproef — hoe meer metingen, hoe betrouwbaarder je conclusie.

Uit die drie ingrediënten berekent de T-Test een getal (de 'T-waarde') en een 'p-waarde'. Die p-waarde vertelt je: "Als er in werkelijkheid géén verschil zou zijn, hoe groot is dan de kans dat ik toch dit resultaat zie?"

Een p-waarde onder de 0,05 betekent meestal: dit verschil is waarschijnlijk echt, niet toevallig. Dat noemen we 'statistisch significant'.

Een voorbeeld uit de praktijk

Je traint een nieuwe versie van je aanbevelingsalgoritme. Je test hem op 100 gebruikers en vergelijkt de klikfrequentie met het oude model, ook getest op 100 gebruikers.

Oud model: gemiddeld 12 kliks per gebruiker
Nieuw model: gemiddeld 15 kliks per gebruiker

Klinkt goed! Maar met een T-Test check je of die 3 extra kliks niet gewoon geluk waren. De test geeft een p-waarde van 0,03 — dus ja, het verschil is significant. Je kunt met vertrouwen het nieuwe model uitrollen.

Zonder T-Test zou je gokken. Met T-Test weet je het (redelijk) zeker.

Waar kom je het tegen?

Bijna overal waar AI-modellen worden geëvalueerd:

A/B-testing — je vergelijkt twee versies van een feature of model en checkt welke beter presteert
Model-evaluatie — voor je een nieuw model in productie neemt, vergelijk je de accuracy, precisie of andere metrics met het oude model
Wetenschappelijk onderzoek — papers over AI gebruiken vaak T-Tests om aan te tonen dat hun nieuwe methode echt beter is dan de oude
Marketing & product analytics — ook buiten AI: conversiemetingen, gebruikerstevredenheid, retentie

Tools als Python (met scipy of statsmodels), R, of zelfs Excel hebben ingebouwde functies voor T-Tests. Je hoeft de wiskunde niet zelf uit te rekenen.

Waarom dit voor jou relevant is

Als je met AI werkt — of je nu zelf modellen bouwt of beslissingen neemt over welk systeem je inzet — loop je constant tegen de vraag aan: "Is dit verschil echt?"

De T-Test geeft je een objectieve, statistische manier om die vraag te beantwoorden. Het voorkomt dat je tijd en geld investeert in een 'verbetering' die eigenlijk geen verbetering was. Of dat je een goed idee afschiet omdat je een paar ongelukkige testresultaten had.

Je hoeft geen wiskundige te zijn om het te gebruiken — maar het is goed om te weten dat dit mechanisme achter de schermen draait wanneer iemand zegt: "We hebben getest, en het werkt significant beter."

FAQ

Veelgestelde vragen over T-Test

De drie meest gestelde vragen over dit onderwerp, kort beantwoord.

Wat is T-Test?

Een statistische test die checkt of het verschil tussen twee groepen echt is, of toevallig. Bijvoorbeeld: presteert jouw AI-model écht beter na een update, of leek het gewoon een gelukje?

Waarom is T-Test belangrijk?

Hoe wordt T-Test toegepast?

Deel:

Laatst bijgewerkt 4 mei 2026