Direct naar inhoud
Alle termenFundamenten & kernconcepten

Wat is Feature Engineering?

Het slim omvormen van ruwe data naar bruikbare kenmerken waar een AI-model mee kan leren — zoals het omrekenen van postcodes naar afstand tot een winkel.

Wat is Feature Engineering

Wat is feature engineering?

Stel je voor: je wilt een AI-model trainen om huizenprijzen te voorspellen. Je hebt een dataset met adressen, bouwjaren en vierkante meters. Maar een computer snapt een adres niet zomaar — "Kerkstraat 12" zegt hem niks. Wat wél helpt: de afstand tot het dichtstbijzijnde centrum, of het aantal scholen in de buurt. Dat omzetten van ruwe informatie naar bruikbare eigenschappen heet feature engineering.

Het is een beetje zoals koken: je krijgt ruwe ingrediënten (data), maar je moet ze snijden, mengen en kruiden (transformeren) voordat je er iets lekkers (een goed voorspellend model) van kunt maken.

Waarom is het zo belangrijk?

AI-modellen zijn eigenlijk simpele rekenmachines die patronen zoeken in getallen. Ze kunnen niet zelf bedenken wat relevant is. Als jij ze alleen maar postcodes geeft, zien ze geen verband met prijzen. Maar geef je ze "afstand tot Amsterdam Centraal" of "gemiddeld inkomen in de buurt", dan ineens wél.

Goed feature engineering kan het verschil maken tussen een model dat maar 60% goed voorspelt en eentje die 85% haalt — zonder dat je het model zelf verandert. Je helpt de AI gewoon slimmer kijken.

Een voorbeeld uit de praktijk

Een webshop wil voorspellen welke klanten waarschijnlijk iets gaan kopen. In de database staat:

  • Laatste bezoek: "12 januari 2024, 14:32"

  • Aantal clicks: 8

  • Winkelwagen: "2 items"

Dat kun je transformeren naar:

  • Dagen sinds laatste bezoek: 45 (makkelijker dan een datum)

  • Clicks per sessie: 8

  • Heeft items in winkelwagen: ja (1) of nee (0)

  • Gemiddelde tijd op pagina: 2,3 minuten

Die laatste feature stond er eerst helemaal niet — die heb je berekend uit andere data. Dat soort creativiteit is feature engineering.

Hoe pak je het aan?

Er zijn een paar standaard-trucs:

  • Getallen combineren: van "lengte" en "breedte" naar "oppervlakte"

  • Categorieën opsplitsen: van "datum" naar "dag van de week" en "maand"

  • Verhoudingen berekenen: "omzet per medewerker" in plaats van alleen "totale omzet"

  • Ontbrekende waarden invullen: een streepje vervangen door het gemiddelde, of door een aparte categorie "onbekend"

  • Tekst naar getallen: van "positieve review" naar een sentiment-score van 0 tot 10

Waar kom je het tegen?

Elke data scientist doet aan feature engineering, vaak handmatig in Python (met bibliotheken als Pandas of Scikit-learn). Maar moderne tools helpen ook:

  • Dataiku, Alteryx, KNIME — visuele platforms waar je data kunt transformeren zonder code

  • AWS SageMaker Data Wrangler, Google Vertex AI Feature Store — cloudtools die automatisch features aanraden

  • AutoML-platforms (H2O.ai, DataRobot) — proberen features automatisch te genereren

Toch blijft het vaak mensenwerk: jij weet dat "afstand tot school" belangrijk is voor gezinnen, een algoritme bedenkt dat niet vanzelf.

Verandert dat met moderne AI?

Deep learning-modellen (zoals die achter ChatGPT zitten) leren wél automatisch relevante features uit ruwe data — daarom noemen we het ook wel representation learning. Je gooit er tekst in, en het model bedenkt zelf welke patronen belangrijk zijn.

Maar voor de meeste bedrijfs-AI (klantenrisico inschatten, voorraad voorspellen) werken klassieke modellen beter — en daar blijft feature engineering cruciaal. Het is de schakel tussen jouw domeinkennis en wat de machine kan leren.

Wat kun je er nu mee?

Als je met data werkt of een AI-project start: denk niet meteen aan het model, maar eerst aan de features. Welke informatie heb je? Wat zou er nóg meer uit af te leiden zijn? Soms is het omrekenen van een datum naar "dagen sinds" al genoeg om je voorspelling 20% beter te maken. Feature engineering is geen trucje — het is de basis van praktische AI.

FAQ

Veelgestelde vragen over Feature Engineering

De drie meest gestelde vragen over dit onderwerp, kort beantwoord.

Wat is Feature Engineering?

Het slim omvormen van ruwe data naar bruikbare kenmerken waar een AI-model mee kan leren — zoals het omrekenen van postcodes naar afstand tot een winkel.

Waarom is Feature Engineering belangrijk?

Stel je voor: je wilt een AI-model trainen om huizenprijzen te voorspellen. Je hebt een dataset met adressen, bouwjaren en vierkante meters. Maar een computer snapt een adres niet zomaar — "Kerkstraat 12" zegt hem niks. Wat wél helpt: de afstand tot het dichtstbijzijnde centrum, of het aantal scholen in de buurt. Dat omzetten van ruwe informatie naar bruikbare eigenschappen heet feature engineering.

Hoe wordt Feature Engineering toegepast?

Het is een beetje zoals koken: je krijgt ruwe ingrediënten (data), maar je moet ze snijden, mengen en kruiden (transformeren) voordat je er iets lekkers (een goed voorspellend model) van kunt maken.

Deel: