Direct naar inhoud
Alle termenData, evaluatie & metrics

Wat is Adjusted R-Squared?

Een verbeterde versie van R-Squared die rekening houdt met het aantal variabelen in je model, zodat je beter kunt zien of extra data je voorspelling echt beter maakt of alleen maar ingewikkelder.

Wat is Adjusted R-Squared

Wat is Adjusted R-Squared eigenlijk?

Stel je voor: je probeert te voorspellen hoeveel een huis kost. Je begint met alleen het aantal vierkante meters, en je model voorspelt de prijs redelijk goed. Vervolgens voeg je tien extra factoren toe: kleur van de voordeur, aantal bomen in de straat, afstand tot de dichtstbijzijnde supermarkt, enzovoort. Je model wordt ingewikkelder, maar wordt het ook echt beter?

Dit is precies waar Adjusted R-Squared je bij helpt. Het is een meetwaarde die aangeeft hoe goed je model werkt, maar dan met een kritische blik: het straft je af als je zomaar allerlei variabelen toevoegt die niet echt nuttig zijn.

De gewone R-Squared (ook wel R²) zegt: "Je model verklaart 85% van de variatie in huizenprijzen!" Dat klinkt goed, maar R-Squared heeft een irritante eigenschap: het wordt bijna altijd beter als je meer variabelen toevoegt, zelfs als die variabelen onzin zijn. Voeg je de schoenenmaat van de vorige eigenaar toe? R-Squared gaat omhoog. Voeg je het aantal letters in de straatnaam toe? Ook omhoog.

Adjusted R-Squared kijkt daar doorheen. Het corrigeert voor het aantal variabelen dat je gebruikt, en kan zelfs omlaag gaan als je nutteloze informatie toevoegt. Zo zie je of die extra complexiteit echt de moeite waard is.

Hoe werkt het in de praktijk?

De berekening achter Adjusted R-Squared houdt rekening met twee dingen:

  • Hoe goed je model de data verklaart (net als gewone R-Squared)

  • Hoeveel variabelen je daarvoor nodig hebt

Hoe meer variabelen je toevoegt zonder echte verbetering, hoe harder Adjusted R-Squared je daarop afrekent. Het werkt als een soort efficiency-score: je krijgt alleen punten voor variabelen die hun gewicht waard zijn.

Een concreet voorbeeld: Je bouwt een model om klanttevredenheid te voorspellen bij een webshop.

  • Met alleen levertijd: R² = 0,60 / Adjusted R² = 0,60

  • Met levertijd + productprijs + aantal eerdere aankopen: R² = 0,75 / Adjusted R² = 0,73

  • Met tien extra variabelen die weinig toevoegen: R² = 0,78 / Adjusted R² = 0,70

Zie je wat er gebeurt? Die laatste tien variabelen maken je gewone R-Squared iets hoger, maar Adjusted R-Squared gaat juist omlaag. Dat is je signaal dat je model niet beter is geworden, alleen maar rommelig.

Waarom zou jij hier iets aan hebben?

Als je met data werkt — of dat nu voor verkoopvoorspellingen is, klantsegmentatie, of het optimaliseren van processen — loop je tegen deze vraag aan: moet ik deze extra gegevens toevoegen of niet?

Adjusted R-Squared helpt je die keuze te maken. Het voorkomt dat je modellen bouwt die op papier goed lijken maar in de praktijk te ingewikkeld en onbetrouwbaar zijn. Het is een rem op overenthousiasme: niet alles wat meer data bevat, is ook beter.

In AI-projecten zie je dit vaak bij feature selection: welke kenmerken neem je mee in je model? Adjusted R-Squared geeft je een objectieve manier om te zien of elke toevoeging echt waarde heeft.

Waar kom je het tegen?

Adjusted R-Squared komt uit de klassieke statistiek, maar wordt nog steeds veel gebruikt bij:

  • Business intelligence tools zoals Tableau, Power BI of SPSS — vooral bij regressie-analyses

  • Data science workflows in Python (scikit-learn, statsmodels) en R — bij het evalueren van lineaire modellen

  • Marketing analytics — bij het voorspellen van conversies, klantwaarde of campagne-effectiviteit

  • Financiële modellen — voor het voorspellen van rendementen of risico's

  • Wetenschappelijk onderzoek — waar onderzoekers willen aantonen dat hun variabelen echt relevant zijn

In moderne deep learning-projecten zie je het minder, omdat die modellen vaak zo complex zijn dat R-Squared minder betekenisvol wordt. Maar voor toegankelijke, verklaarbare modellen blijft het een belangrijke graadmeter.

Wat kun je er nu mee?

Als je zelf modellen bouwt of beoordeelt, gebruik Adjusted R-Squared als tegenwicht tegen de neiging om steeds meer variabelen toe te voegen. Vraag jezelf af: gaat mijn Adjusted R-Squared omhoog of omlaag als ik dit toevoeg? Zo houd je je model scherp en begrijpelijk, in plaats van een opgeblazen spreadsheet waar niemand meer doorheen komt. En dat scheelt niet alleen tijd en rekenkracht, maar maakt je voorspellingen vaak ook betrouwbaarder.

FAQ

Veelgestelde vragen over Adjusted R-Squared

De drie meest gestelde vragen over dit onderwerp, kort beantwoord.

Wat is Adjusted R-Squared?

Een verbeterde versie van R-Squared die rekening houdt met het aantal variabelen in je model, zodat je beter kunt zien of extra data je voorspelling echt beter maakt of alleen maar ingewikkelder.

Waarom is Adjusted R-Squared belangrijk?

Stel je voor: je probeert te voorspellen hoeveel een huis kost. Je begint met alleen het aantal vierkante meters, en je model voorspelt de prijs redelijk goed. Vervolgens voeg je tien extra factoren toe: kleur van de voordeur, aantal bomen in de straat, afstand tot de dichtstbijzijnde supermarkt, enzovoort. Je model wordt ingewikkelder, maar wordt het ook echt beter?

Hoe wordt Adjusted R-Squared toegepast?

Dit is precies waar Adjusted R-Squared je bij helpt. Het is een meetwaarde die aangeeft hoe goed je model werkt, maar dan met een kritische blik: het straft je af als je zomaar allerlei variabelen toevoegt die niet echt nuttig zijn.

Deel: