Direct naar inhoud
Alle termenLarge Language Models & NLP

Wat is Text Classification?

Een AI-techniek die tekst automatisch in categorieën indeelt — zoals spam-herkenning, sentimentanalyse of taaldetectie. De machine leert herkennen welk label bij welke tekst hoort.

Wat is Text Classification

Wat is text classification?

Text classification (tekstclassificatie) is een techniek waarbij een AI-systeem tekst automatisch in categorieën indeelt. Stel je voor: je krijgt duizenden e-mails binnen en wilt ze sorteren op onderwerp, urgentie of sentiment. Of je hebt klantreviews en wilt weten welke positief zijn en welke negatief. Text classification doet dat voor je — het leest de tekst en plakt er een label op.

De machine leert dit door voorbeelden te bestuderen. Je laat het systeem honderden of duizenden gelabelde teksten zien (bijvoorbeeld "dit is spam", "dit is geen spam"), en het leert patronen herkennen: bepaalde woorden, zinsbouw of stijlkenmerken die wijzen op een categorie. Daarna kan het nieuwe, ongeziene teksten classificeren.

Hoe werkt het eigenlijk?

Bij text classification werkt de AI in twee fases:

De leerfase (training) Je voedt het systeem met voorbeelden: teksten die al een label hebben. Bijvoorbeeld 10.000 nieuwsartikelen die al zijn ingedeeld in "sport", "economie", "cultuur". Het systeem analyseert welke woorden, zinsdelen of patronen vaak voorkomen in elke categorie. "Voetbal", "wedstrijd" en "goal" duiden vaak op sport; "rente", "inflatie" en "aandelen" op economie.

Moderne systemen gebruiken vaak neural networks of transformers (zoals BERT of GPT) om niet alleen losse woorden te zien, maar ook context en betekenis. Ze begrijpen bijvoorbeeld dat "Apple verliest rechtszaak" over een bedrijf gaat, niet over fruit.

De toepassingsfase (inference) Als het model getraind is, geef je het nieuwe tekst. Het rekent uit welk label het waarschijnlijkst is en geeft een voorspelling — vaak met een zekerheidspercentage. "Deze review is met 92% zekerheid positief."

Een voorbeeld uit de praktijk

Stel: je runt een webshop en krijgt dagelijks honderden klantbeoordelingen binnen. Je wilt snel weten welke klanten ontevreden zijn, zodat je klantenservice prioriteit kan geven.

Een text classification-model sorteert elke review automatisch in "positief", "neutraal" of "negatief". Negatieve reviews belanden direct in een dashboard voor je supportteam. Zo voorkom je dat boze klanten dagenlang wachten — en bespaar je uren handmatig leeswerk.

Of denk aan een gemeente die burgerklachten binnenkrijgt via mail. Een classificatiemodel deelt ze in: "verkeer", "afval", "groen", "buurtoverlast". Elke klacht gaat automatisch naar de juiste afdeling, zonder dat iemand eerst alles moet lezen en doorsturen.

Waar kom je het tegen?

Text classification zit overal waar tekst automatisch gesorteerd wordt:

  • Spamfilters — je mailprovider (Gmail, Outlook, Proton) scant inkomende mail en filtert spam eruit

  • Sentimentanalyse — bedrijven analyseren social media of reviews om te zien hoe klanten over hen denken

  • Klantenservice-routing — chatbots of ticketsystemen (Zendesk, Freshdesk) verdelen vragen over afdelingen

  • Contentmoderatie — platforms zoals Facebook, YouTube of Reddit detecteren haatzaaiende of ongepaste content

  • Documentsortering — juridische of financiële teams categoriseren contracten, facturen of juridische stukken

  • Taaldetectie — Google Translate of DeepL herkennen automatisch in welke taal je schrijft

  • Nieuwscategorisatie — nieuwsapps of aggregators sorteren artikelen op onderwerp

Veel van deze systemen gebruiken modellen zoals BERT, RoBERTa, DistilBERT of GPT-varianten. Ook leveranciers als OpenAI, Anthropic, Google Cloud, AWS en Azure bieden API's voor text classification.

Waarom is dit relevant voor jou?

Text classification bespaart tijd en zorgt voor consistentie. Waar een mens misschien per ongeluk iets over het hoofd ziet of inconsistent labelt, blijft een goed getraind model objectief werken — 24/7, zonder moe te worden.

Daarbij: naarmate je meer data hebt, wordt het model beter. Het leert van fouten (als je correcties aanbrengt) en kan steeds nauwkeuriger werken. Voor organisaties die dagelijks honderden of duizenden teksten moeten verwerken, is dat een game-changer in efficiency.

Wil je hiermee aan de slag? Begin klein: kies één heldere use case (bijvoorbeeld klanttevredenheid meten of mails sorteren), verzamel gelabelde voorbeelden en test een bestaande API of tool. Je hoeft geen AI-expert te zijn om text classification toe te passen — de techniek is volwassen en toegankelijk geworden.

FAQ

Veelgestelde vragen over Text Classification

De drie meest gestelde vragen over dit onderwerp, kort beantwoord.

Wat is Text Classification?

Een AI-techniek die tekst automatisch in categorieën indeelt — zoals spam-herkenning, sentimentanalyse of taaldetectie. De machine leert herkennen welk label bij welke tekst hoort.

Waarom is Text Classification belangrijk?

Text classification (tekstclassificatie) is een techniek waarbij een AI-systeem tekst automatisch in categorieën indeelt. Stel je voor: je krijgt duizenden e-mails binnen en wilt ze sorteren op onderwerp, urgentie of sentiment. Of je hebt klantreviews en wilt weten welke positief zijn en welke negatief. Text classification doet dat voor je — het leest de tekst en plakt er een label op.

Hoe wordt Text Classification toegepast?

De machine leert dit door voorbeelden te bestuderen. Je laat het systeem honderden of duizenden gelabelde teksten zien (bijvoorbeeld "dit is spam", "dit is geen spam"), en het leert patronen herkennen: bepaalde woorden, zinsbouw of stijlkenmerken die wijzen op een categorie. Daarna kan het nieuwe, ongeziene teksten classificeren.

Deel: