Alle termenKlassieke Machine Learning

Wat is Linear Discriminant Analysis?

Een klassieke ML-techniek die data in groepen splitst door een optimale scheidingslijn te vinden — alsof je appels en peren scheidt op basis van gewicht en kleur.

Wat is Linear Discriminant Analysis?

Linear Discriminant Analysis (LDA) is een klassieke machine learning-techniek die data in verschillende groepen verdeelt door een optimale scheidingslijn te vinden. Stel je voor dat je een grote bak met appels en peren hebt, en je wilt ze automatisch sorteren. LDA kijkt naar kenmerken zoals gewicht, kleur en vorm, en trekt dan een denkbeeldige lijn die de twee groepen het beste van elkaar scheidt.

Het bijzondere aan LDA is dat het niet zomaar een willekeurige lijn trekt. Het zoekt naar de lijn waarbij:

De groepen zo ver mogelijk uit elkaar liggen (appels aan de ene kant, peren aan de andere)
Binnen elke groep de variatie zo klein mogelijk is (alle appels lijken meer op elkaar)

Deze techniek komt uit de statistiek en bestaat al sinds de jaren '30. In de AI-wereld wordt het vooral gebruikt als een eenvoudige, snelle manier om data te classificeren — voordat er complexere technieken zoals neural networks bestonden, was dit dé methode.

Hoe werkt het eigenlijk?

LDA werkt in drie stappen die je kunt vergelijken met het sorteren van fruit:

Stap 1: Kenmerken meten Je meet van elke appel en peer allerlei eigenschappen: gewicht, diameter, kleur-intensiteit. Dit zijn je 'features' — de getallen waarmee het algoritme werkt.

Stap 2: De ideale scheidingslijn zoeken LDA berekent waar de gemiddelde appel en de gemiddelde peer zitten in deze meetruimte. Vervolgens zoekt het de richting waarin die twee gemiddeldes het verst uit elkaar liggen, terwijl de spreiding binnen elk groepje klein blijft. Dat wordt je scheidingslijn.

Stap 3: Nieuwe data classificeren Als je nu een nieuw stuk fruit meet, kijk je aan welke kant van de lijn het valt. Links van de lijn? Dan is het waarschijnlijk een appel. Rechts? Dan een peer.

Het woord 'linear' betekent dat de scheidingslijn altijd recht is — geen kromme of golvende grens. Dat maakt LDA snel en efficient, maar ook beperkt: als je groepen elkaar overlappen in een gekronkeld patroon, kan LDA daar niet goed mee omgaan.

Waarom zou je Linear Discriminant Analysis gebruiken?

LDA heeft een paar duidelijke voordelen:

Snelheid en eenvoud Het werkt razendsnel, zelfs op grote datasets. Je hebt geen GPU nodig en geen uren training — perfect voor situaties waar je snel een eerste inzicht wilt.

Interpreteerbaar Je kunt precies zien waarom het algoritme een keuze maakt: welke kenmerken wegen het zwaarst mee? Bij een neural network is dat vaak een black box, bij LDA zie je gewoon de coëfficiënten.

Goed voor kleine datasets Als je maar weinig voorbeelden hebt (bijvoorbeeld 100 patiënten in een medisch onderzoek), presteren complexe modellen vaak slecht. LDA kan met minder data al goede resultaten geven.

Dimensie-reductie LDA kun je ook gebruiken om data te vereenvoudigen voordat je het aan een ander model voert. Je hebt 50 kenmerken? LDA kan dat terugbrengen naar 3 relevante assen.

De keerzijde: LDA gaat ervan uit dat je data 'netjes' verdeeld is (normale verdeling) en dat de groepen vergelijkbare spreiding hebben. In de praktijk is dat vaak niet zo — daarom is LDA vooral een 'baseline' geworden: je probeert het eerst, en als het niet goed genoeg werkt, schakel je over naar een complexer model.

Een voorbeeld uit de praktijk

Stel: je werkt bij een ziekenhuis en wilt op basis van drie bloedwaarden voorspellen of een patiënt diabetes heeft of niet. Je hebt 500 patiëntendossiers met hun glucosewaarde, cholesterol en bloeddruk, plus de diagnose (wel/geen diabetes).

Met LDA train je een model dat leert: "Ah, bij glucosewaarden boven de 120 en cholesterol boven de 200 zie ik meestal diabetes, bij lage waarden meestal niet." Het trekt een scheidingsvlak door die driedimensionale ruimte. Als er nu een nieuwe patiënt binnenkomt met onbekende diagnose, voer je de drie bloedwaarden in, en LDA zegt: "Deze persoon valt in de diabetes-groep" of "Deze persoon valt in de gezonde groep".

Het is niet perfect — sommige mensen hebben grijze waarden — maar het geeft artsen een snel, geautomatiseerd eerste signaal. In de echte zorg wordt LDA vaak gecombineerd met andere methoden voor een definitieve diagnose.

Waar kom je het tegen?

Je vindt Linear Discriminant Analysis terug in:

Gezichtsherkenning (klassiek): Vroege gezichtsherkenningstechnieken gebruikten LDA om gezichten te onderscheiden op basis van afstanden tussen ogen, neus en mond
Kredietbeoordeling: Banken gebruiken soms LDA om klanten te classificeren als 'hoog risico' of 'laag risico' op basis van inkomen, schulden en betaalgeschiedenis
Medische diagnostiek: Snelle screening-tools voor ziektes waarbij je een paar meetwaarden hebt
Marketing-segmentatie: Klanten indelen in groepen (kopers/niet-kopers) op basis van gedragsdata
Kwaliteitscontrole in productie: Automatisch detecteren of een product aan de norm voldoet of afgekeurd moet worden

In Python-bibliotheken zoals scikit-learn vind je LDA onder LinearDiscriminantAnalysis(). Het wordt vaak gebruikt als vergelijkingsmateriaal: eerst draai je een simpel LDA-model, dan kijk je of een complex deep learning-model echt beter scoort — en of die extra complexiteit de moeite waard is.

Wat kun je er nu mee?

Als je zelf met classificatieproblemen werkt (bijvoorbeeld klanten segmenteren, afbeeldingen sorteren, of patronen in data herkennen), probeer dan LDA als eerste stap. Het is laagdrempelig, snel te implementeren, en geeft je meteen een gevoel voor je data: zijn de groepen überhaupt te scheiden? Als LDA al 85% accuraat is, weet je dat je probleem oplosbaar is. Scoort het 55%? Dan heb je waarschijnlijk te weinig onderscheidende kenmerken, of je groepen overlappen té veel voor een simpele aanpak.

Zie LDA als de thermometer van machine learning: niet de geavanceerdste tool, maar wel een die je snel laat zien waar je staat.

FAQ

Veelgestelde vragen over Linear Discriminant Analysis

De drie meest gestelde vragen over dit onderwerp, kort beantwoord.

Wat is Linear Discriminant Analysis?

Een klassieke ML-techniek die data in groepen splitst door een optimale scheidingslijn te vinden — alsof je appels en peren scheidt op basis van gewicht en kleur.

Waarom is Linear Discriminant Analysis belangrijk?

Hoe wordt Linear Discriminant Analysis toegepast?

Het bijzondere aan LDA is dat het niet zomaar een willekeurige lijn trekt. Het zoekt naar de lijn waarbij:

Deel:

Laatst bijgewerkt 4 mei 2026