Direct naar inhoud
Alle termenLarge Language Models & NLP

Wat is Extractive Summarization?

Een techniek waarbij de belangrijkste zinnen uit een tekst worden gekopieerd en samengevoegd tot een korte samenvatting — zonder de tekst te herschrijven.

Wat is Extractive Summarization

Wat is extractive summarization?

Stel je voor dat je een lange nieuwsbrief van 20 pagina's moet samenvatten. Je pakt een gele markeerstift, streept de belangrijkste zinnen aan en plakt die achter elkaar — klaar is je samenvatting. Dat is in een notendop extractive summarization: een AI-techniek die de belangrijkste stukken tekst uit een document haalt en die onveranderd achter elkaar zet.

De term betekent letterlijk 'samenvatten door extractie' — je haalt er dingen uit (extract), zonder zelf nieuwe zinnen te bedenken. De originele woorden en zinnen blijven dus precies zoals ze zijn. Dat is een belangrijk verschil met andere vormen van samenvatten, waarbij AI wél zelf nieuwe zinnen schrijft.

Hoe werkt het eigenlijk?

Achterin het systeem gebeurt dit:

  • De AI leest de hele tekst en geeft elke zin een 'belangrijk­heids­score'

  • Die score is gebaseerd op dingen zoals: hoe vaak komen bepaalde woorden voor, staat de zin aan het begin of eind van een alinea, bevat de zin centrale begrippen?

  • De zinnen met de hoogste scores worden gekopieerd en achter elkaar gezet

  • Het resultaat is een samenvatting die alleen uit originele zinnen bestaat

Vroeger deden systemen dit vooral met statistische trucs (woord­frequenties tellen). Tegenwoordig gebruiken veel systemen machine learning-modellen die beter kunnen inschatten welke zinnen echt centraal staan.

Een voorbeeld uit de praktijk

Stel, je hebt een artikel van 800 woorden over een nieuw klimaatrapport. Een extractive summarization-tool pikt er drie zinnen uit:

  • "Het IPCC waarschuwt dat de opwarming sneller gaat dan eerder gedacht."

  • "Zonder extra maatregelen stijgt de temperatuur met 2,7 graden."

  • "Experts roepen overheden op om voor 2030 koolstofuitstoot te halveren."

Die drie zinnen staan letterlijk zo in het artikel. De tool heeft ze niet herschreven, alleen geselecteerd en gekopieerd. Dat is extractive summarization in actie.

Waar kom je het tegen?

Je ziet deze techniek vooral waar betrouwbaarheid en letterlijke citering belangrijk zijn:

  • Nieuwsaggregators — Google News, Apple News en andere nieuwsapps gebruiken extractive methodes om highlights te tonen

  • Juridische en medische software — omdat letterlijke tekst vaak wettelijk of medisch relevant is

  • Onderzoekstools — als wetenschappers snel door stapels papers willen zonder interpretatie

  • Chatbots en klantenservice — om FAQ's automatisch samen te vatten uit helpcentrum-artikelen

Ook tools zoals SummarizeBot, SMMRY en onderdelen van Copilot gebruiken extractive technieken, vaak in combinatie met andere methodes.

Wat zijn de voor- en nadelen?

Voordelen:

  • Betrouwbaar — geen risico op 'hallucinaties' of verdraaide betekenis

  • Snel en efficiënt — je hoeft niet na te denken over hoe je iets herformuleert

  • Geschikt voor gevoelige teksten — juridisch, medisch, wetenschappelijk

Nadelen:

  • Kan houterig lezen — zinnen uit verschillende delen van een tekst passen soms niet mooi achter elkaar

  • Mist context — omdat je alleen zinnen pikt, ontbreekt soms de logische opbouw

  • Minder compact — je kunt vaak korter als je wél mag herschrijven

Het verschil met abstractive summarization

Als je weleens gehoord hebt van abstractive summarization (samenvatten door herschrijven), dan is het verschil nu duidelijk: extractive = kopiëren, abstractive = herschrijven. Veel moderne AI-tools combineren beide: ze pikken eerst de belangrijkste delen (extractive) en schrijven die daarna om tot een vloeiende tekst (abstractive).

Wat kun je ermee als ondernemer of professional?

Als je dagelijks veel rapporten, nieuwsbrieven of onderzoeken leest, kan extractive summarization je uren schelen. Je kunt:

  • Juridische of compliance-documenten snel screenen op kernzinnen

  • Lange klantenreviews automatisch laten reduceren tot de belangrijkste klachten of complimenten

  • Nieuwsartikelen filteren op relevantie voordat je ze helemaal leest

Let wel: extractive tools zijn geen wondermiddel. Ze helpen je prioriteren, maar vervangen niet het lezen zelf — zeker niet als nuance of context cruciaal zijn. Zie het als een slimme markeerstift, niet als een volledige leesrobot.

FAQ

Veelgestelde vragen over Extractive Summarization

De drie meest gestelde vragen over dit onderwerp, kort beantwoord.

Wat is Extractive Summarization?

Een techniek waarbij de belangrijkste zinnen uit een tekst worden gekopieerd en samengevoegd tot een korte samenvatting — zonder de tekst te herschrijven.

Waarom is Extractive Summarization belangrijk?

Stel je voor dat je een lange nieuwsbrief van 20 pagina's moet samenvatten. Je pakt een gele markeerstift, streept de belangrijkste zinnen aan en plakt die achter elkaar — klaar is je samenvatting. Dat is in een notendop extractive summarization: een AI-techniek die de belangrijkste stukken tekst uit een document haalt en die onveranderd achter elkaar zet.

Hoe wordt Extractive Summarization toegepast?

De term betekent letterlijk 'samenvatten door extractie' — je haalt er dingen uit (extract), zonder zelf nieuwe zinnen te bedenken. De originele woorden en zinnen blijven dus precies zoals ze zijn. Dat is een belangrijk verschil met andere vormen van samenvatten, waarbij AI wél zelf nieuwe zinnen schrijft.

Deel: