Direct naar inhoud
Alle termenLarge Language Models & NLP

Wat is Abstractive Summarization?

Een techniek waarbij AI een tekst samenvat door nieuwe zinnen te formuleren in plaats van bestaande zinnen te kopiëren — vergelijkbaar met hoe jij een film navertelt aan een vriend.

Wat is Abstractive Summarization

Wat is het verschil met een gewone samenvatting?

Stel je voor: je hebt een boek gelezen en een vriend vraagt wat het over ging. Je gaat niet woord voor woord zinnen uit het boek voorlezen — je vertelt het in je eigen woorden. Je vangt de essentie, maar formuleert het helemaal zelf. Dat is precies wat abstractive summarization doet.

Bij de klassieke methode (extractive summarization) pikt AI gewoon de belangrijkste zinnen uit de originele tekst en plakt die achter elkaar. Bij abstractive summarization schrijft de AI nieuwe zinnen die de betekenis weergeven, maar niet per se in de originele tekst stonden. Het model begrijpt wat er staat, destilleert de kernboodschap en herformuleert die in eigen bewoordingen.

Hoe werkt het eigenlijk?

Moderne taalmodellen zoals GPT, Claude of Gemini zijn hier erg goed in. Ze zijn getraind op enorme hoeveelheden tekst en hebben daardoor geleerd hoe ideeën met elkaar samenhangen — niet alleen welke woorden vaak samen voorkomen, maar ook wat concepten betekenen.

Het proces werkt ongeveer zo:

  • Het model leest de hele tekst en bouwt een intern begrip op van wat er staat

  • Het identificeert de kernpunten: wat is belangrijk, wat is illustratie of herhaling?

  • Het genereert nieuwe zinnen die die kernpunten overbrengen, vaak korter en helderder dan het origineel

  • Het zorgt ervoor dat de samenvatting logisch en leesbaar is — geen geknipt-en-geplakte zinnenbrij

Omdat het model begrijpt wat woorden betekenen (en niet alleen hun vorm herkent), kan het synoniemen gebruiken, zinnen omschrijven en zelfs conclusies trekken die impliciet in de tekst lagen.

Een voorbeeld uit de praktijk

Stel je voor: een nieuwsartikel van 800 woorden over een nieuw klimaatakkoord. Een extractive samenvatting zou de drie belangrijkste zinnen eruit halen en achter elkaar plakken — soms een beetje houterig.

Een abstractive samenvatting zou schrijven: "Vijftig landen hebben afgesproken hun CO₂-uitstoot te verlagen met 40% voor 2035, met extra steun voor ontwikkelingslanden." Die zin stond misschien niet letterlijk zo in het artikel, maar vangt wel de essentie — herschreven, geherformuleerd, begrijpelijk.

Of neem een juridisch contract van 30 pagina's. Een abstractive samenvatting kan dat terugbrengen tot: "Je mag het product gebruiken voor intern gebruik, maar niet doorverkopen. Je bent zelf verantwoordelijk voor dataverlies. De leverancier kan de voorwaarden aanpassen met 30 dagen kennisgeving." Dat zijn geen gekopieerde clausules, maar een heldere vertaling.

Waar kom je het tegen?

  • ChatGPT, Claude, Gemini, Copilot — wanneer je vraagt "vat dit artikel samen", gebruiken ze abstractive summarization

  • Notion AI, Craft, Obsidian — samenvat je notities of documenten in eigen woorden

  • Slack, Teams, Gmail — samenvat lange gesprekken of mailthreads

  • Perplexity, Bing Chat — vat zoekresultaten samen in een antwoord dat je direct kunt lezen

  • Speechify, Natural Reader — maakt samenvattingen van lange podcasts of artikelen

  • Legal AI-tools (Harvey, Casetext) — vat contracten en rechtszaken samen voor juristen

  • Nieuwsaggregators — bundelt meerdere artikelen over hetzelfde onderwerp in één overzicht

De kracht zit 'm vooral in lange teksten begrijpelijk maken zonder dat je alles zelf hoeft te lezen. Denk aan onderzoeksrapporten, klantenreviews, vergadernotulen, academische papers.

Wat zijn de valkuilen?

Omdat het model nieuwe zinnen schrijft, kan het soms iets toevoegen dat er niet stond — een lichte hallucinatie. Of het kan nuance weglaten die wél belangrijk was. Bij extractive summarization weet je zeker dat elke zin letterlijk in het origineel stond; bij abstractive summarization moet je het model vertrouwen dat het de betekenis goed heeft begrepen.

Daarom: gebruik het vooral voor een eerste indruk of om snel door veel informatie heen te gaan. Voor cruciale beslissingen (juridisch, medisch, financieel) check je altijd de bron zelf.

Waarom zou jij hier iets aan hebben?

Als je dagelijks overspoeld wordt met rapporten, e-mails, nieuwsartikelen of onderzoeksmateriaal, scheelt abstractive summarization je uren leeswerk. Je kunt in een paar seconden de kern van een document begrijpen en beslissen of je dieper in wilt duiken.

Het mooie: de samenvattingen zijn vaak leesbaarder dan het origineel. Waar een wetenschappelijk paper vol jargon staat, kan een abstractive samenvatting je in gewone taal vertellen wat de onderzoekers hebben ontdekt. Waar een contractclausule over drie alinea's slingert, kan de samenvatting het in twee zinnen uitleggen.

Probeer het zelf: pak een lang artikel dat je al een tijdje wilt lezen, plak het in ChatGPT of Claude, en vraag: "Vat dit samen in drie alinea's." Je zult zien dat het model niet gewoon zinnen kopieert, maar het verhaal opnieuw vertelt — net zoals jij dat zou doen na het lezen.

FAQ

Veelgestelde vragen over Abstractive Summarization

De drie meest gestelde vragen over dit onderwerp, kort beantwoord.

Wat is Abstractive Summarization?

Een techniek waarbij AI een tekst samenvat door nieuwe zinnen te formuleren in plaats van bestaande zinnen te kopiëren — vergelijkbaar met hoe jij een film navertelt aan een vriend.

Waarom is Abstractive Summarization belangrijk?

Stel je voor: je hebt een boek gelezen en een vriend vraagt wat het over ging. Je gaat niet woord voor woord zinnen uit het boek voorlezen — je vertelt het in je eigen woorden. Je vangt de essentie, maar formuleert het helemaal zelf. Dat is precies wat abstractive summarization doet.

Hoe wordt Abstractive Summarization toegepast?

Bij de klassieke methode (extractive summarization) pikt AI gewoon de belangrijkste zinnen uit de originele tekst en plakt die achter elkaar. Bij abstractive summarization schrijft de AI nieuwe zinnen die de betekenis weergeven, maar niet per se in de originele tekst stonden. Het model begrijpt wat er staat, destilleert de kernboodschap en herformuleert die in eigen bewoordingen.

Deel: