Wat is Extractive Summarization?
Een techniek waarbij de belangrijkste zinnen uit een tekst worden gekopieerd en samengevoegd tot een korte samenvatting — zonder de tekst te herschrijven.

Wat is extractive summarization?
Stel je voor dat je een lange nieuwsbrief van 20 pagina's moet samenvatten. Je pakt een gele markeerstift, streept de belangrijkste zinnen aan en plakt die achter elkaar — klaar is je samenvatting. Dat is in een notendop extractive summarization: een AI-techniek die de belangrijkste stukken tekst uit een document haalt en die onveranderd achter elkaar zet.
De term betekent letterlijk 'samenvatten door extractie' — je haalt er dingen uit (extract), zonder zelf nieuwe zinnen te bedenken. De originele woorden en zinnen blijven dus precies zoals ze zijn. Dat is een belangrijk verschil met andere vormen van samenvatten, waarbij AI wél zelf nieuwe zinnen schrijft.
Hoe werkt het eigenlijk?
Achterin het systeem gebeurt dit:
De AI leest de hele tekst en geeft elke zin een 'belangrijkheidsscore'
Die score is gebaseerd op dingen zoals: hoe vaak komen bepaalde woorden voor, staat de zin aan het begin of eind van een alinea, bevat de zin centrale begrippen?
De zinnen met de hoogste scores worden gekopieerd en achter elkaar gezet
Het resultaat is een samenvatting die alleen uit originele zinnen bestaat
Vroeger deden systemen dit vooral met statistische trucs (woordfrequenties tellen). Tegenwoordig gebruiken veel systemen machine learning-modellen die beter kunnen inschatten welke zinnen echt centraal staan.
Een voorbeeld uit de praktijk
Stel, je hebt een artikel van 800 woorden over een nieuw klimaatrapport. Een extractive summarization-tool pikt er drie zinnen uit:
"Het IPCC waarschuwt dat de opwarming sneller gaat dan eerder gedacht."
"Zonder extra maatregelen stijgt de temperatuur met 2,7 graden."
"Experts roepen overheden op om voor 2030 koolstofuitstoot te halveren."
Die drie zinnen staan letterlijk zo in het artikel. De tool heeft ze niet herschreven, alleen geselecteerd en gekopieerd. Dat is extractive summarization in actie.
Waar kom je het tegen?
Je ziet deze techniek vooral waar betrouwbaarheid en letterlijke citering belangrijk zijn:
Nieuwsaggregators — Google News, Apple News en andere nieuwsapps gebruiken extractive methodes om highlights te tonen
Juridische en medische software — omdat letterlijke tekst vaak wettelijk of medisch relevant is
Onderzoekstools — als wetenschappers snel door stapels papers willen zonder interpretatie
Chatbots en klantenservice — om FAQ's automatisch samen te vatten uit helpcentrum-artikelen
Ook tools zoals SummarizeBot, SMMRY en onderdelen van Copilot gebruiken extractive technieken, vaak in combinatie met andere methodes.
Wat zijn de voor- en nadelen?
Voordelen:
Betrouwbaar — geen risico op 'hallucinaties' of verdraaide betekenis
Snel en efficiënt — je hoeft niet na te denken over hoe je iets herformuleert
Geschikt voor gevoelige teksten — juridisch, medisch, wetenschappelijk
Nadelen:
Kan houterig lezen — zinnen uit verschillende delen van een tekst passen soms niet mooi achter elkaar
Mist context — omdat je alleen zinnen pikt, ontbreekt soms de logische opbouw
Minder compact — je kunt vaak korter als je wél mag herschrijven
Het verschil met abstractive summarization
Als je weleens gehoord hebt van abstractive summarization (samenvatten door herschrijven), dan is het verschil nu duidelijk: extractive = kopiëren, abstractive = herschrijven. Veel moderne AI-tools combineren beide: ze pikken eerst de belangrijkste delen (extractive) en schrijven die daarna om tot een vloeiende tekst (abstractive).
Wat kun je ermee als ondernemer of professional?
Als je dagelijks veel rapporten, nieuwsbrieven of onderzoeken leest, kan extractive summarization je uren schelen. Je kunt:
Juridische of compliance-documenten snel screenen op kernzinnen
Lange klantenreviews automatisch laten reduceren tot de belangrijkste klachten of complimenten
Nieuwsartikelen filteren op relevantie voordat je ze helemaal leest
Let wel: extractive tools zijn geen wondermiddel. Ze helpen je prioriteren, maar vervangen niet het lezen zelf — zeker niet als nuance of context cruciaal zijn. Zie het als een slimme markeerstift, niet als een volledige leesrobot.
Veelgestelde vragen over Extractive Summarization
De drie meest gestelde vragen over dit onderwerp, kort beantwoord.
Wat is Extractive Summarization?
Een techniek waarbij de belangrijkste zinnen uit een tekst worden gekopieerd en samengevoegd tot een korte samenvatting — zonder de tekst te herschrijven.
Waarom is Extractive Summarization belangrijk?
Stel je voor dat je een lange nieuwsbrief van 20 pagina's moet samenvatten. Je pakt een gele markeerstift, streept de belangrijkste zinnen aan en plakt die achter elkaar — klaar is je samenvatting. Dat is in een notendop extractive summarization: een AI-techniek die de belangrijkste stukken tekst uit een document haalt en die onveranderd achter elkaar zet.
Hoe wordt Extractive Summarization toegepast?
De term betekent letterlijk 'samenvatten door extractie' — je haalt er dingen uit (extract), zonder zelf nieuwe zinnen te bedenken. De originele woorden en zinnen blijven dus precies zoals ze zijn. Dat is een belangrijk verschil met andere vormen van samenvatten, waarbij AI wél zelf nieuwe zinnen schrijft.