Wat is Greedy Decoding?
Een methode waarbij een AI-model bij elke stap het meest waarschijnlijke woord kiest. Snel en simpel, maar kan tot saaie of herhalende teksten leiden.

Hoe werkt het eigenlijk?
Stel je voor dat je een verhaal schrijft en bij elk woord kiest voor de allereerste optie die in je opkomt — zonder na te denken over alternatieven. Dat is in essentie greedy decoding.
Wanneer een taalmodel zoals GPT of Claude een tekst genereert, doet het dat woord voor woord (of eigenlijk: token voor token). Bij elke stap berekent het model voor duizenden mogelijke woorden een waarschijnlijkheidsscore: "hoe waarschijnlijk is het dat dit woord hier past?" Greedy decoding pakt simpelweg altijd het woord met de hoogste score. Klaar. Volgende woord.
Een simpel voorbeeld: Zin tot nu toe: "De kat zat op de..."
"mat" krijgt 65% waarschijnlijkheid
"bank" krijgt 20%
"vensterbank" krijgt 10%
"wasmachine" krijgt 5%
Greedy decoding kiest: mat. Altijd. Elke keer opnieuw.
Het voordeel? Het is razendsnel en voorspelbaar. Je krijgt geen rare verrassingen. Het nadeel? De tekst kan saai, repetitief of té voor de hand liggend worden. Het model neemt geen risico's, verkent geen creatieve omwegen, en kan makkelijk in herhalingslussen terechtkomen.
Waarom zou je hier iets van merken?
Als je dezelfde vraag meerdere keren aan een AI stelt en steeds exact hetzelfde antwoord terugkrijgt, is de kans groot dat er greedy decoding wordt gebruikt. Veel chatbots en AI-assistenten gebruiken dit als standaardmethode, omdat het betrouwbaar en snel is — vooral belangrijk als er duizenden gebruikers tegelijk vragen stellen.
Maar stel dat je een creatief verhaal wilt, brainstormsuggesties zoekt, of juist variatie nodig hebt in je AI-gegenereerde content. Dan is greedy decoding vaak te eendimensionaal. Daarom hebben moderne taalmodellen ook andere strategieën:
Beam search — houdt meerdere kandidaat-zinnen tegelijk bij en kiest uiteindelijk de beste
Sampling met temperature — voegt bewust toeval toe, zodat ook minder waarschijnlijke woorden een kans krijgen
Top-k en top-p sampling — beperkt de keuze tot de meest veelbelovende opties, maar laat binnen die groep ruimte voor variatie
Greedy decoding is dus één uiterste van het spectrum: maximale voorspelbaarheid, minimale creativiteit.
Een voorbeeld uit de praktijk
Stel je gebruikt een AI-tool om productbeschrijvingen te schrijven voor een webshop. Met greedy decoding krijg je elke keer dezelfde soort zinnen:
"Deze stoel is comfortabel en stijlvol. Perfect voor in de woonkamer. Verkrijgbaar in meerdere kleuren."
Niet verkeerd, maar ook niet spannend. Als je de instellingen aanpast en sampling aanzet, krijg je ineens variaties:
"Ga lekker onderuitzakken in deze fauteuil die eruitziet alsof hij uit een designmuseum komt."
Datzelfde mechanisme speelt bij klantenservice-bots, vertalingen, samenvattingen — overal waar een AI tekst produceert, is er een keuze gemaakt over hoe die woorden geselecteerd worden.
Waar kom je het tegen?
Greedy decoding is de standaard in veel productie-omgevingen waar snelheid en consistentie belangrijker zijn dan creativiteit:
Chatbots en klantenservice (snelle, betrouwbare antwoorden)
Vertalingen (vooral bij systemen zoals Google Translate, waar je één correcte vertaling wilt)
Samenvattingen van documenten (zakelijk, to the point)
Voice assistants (Siri, Alexa) voor standaardcommando's
Daarnaast zie je het terug in API's van OpenAI (ChatGPT), Anthropic (Claude), Google (Gemini) en Mistral — vaak als standaardinstelling, met opties om over te schakelen naar sampling.
Wat kun je ermee?
Als je zelf met AI-tools werkt, is het goed om te weten dat je invloed hebt op hoe creatief of voorspelbaar de output is. Check in de instellingen of er een "temperature" of "sampling"-optie is:
Temperature op 0 = greedy decoding (of bijna: het meest waarschijnlijke woord)
Temperature hoger = meer variatie en creativiteit
Wil je consistente, feitelijke teksten? Laat greedy decoding zijn werk doen. Wil je verrassende ideeën of gevarieerde content? Zet sampling aan. Zo haal je meer uit dezelfde AI — niet door een beter model te kiezen, maar door slim te sturen hoe het model kiest.
Veelgestelde vragen over Greedy Decoding
De drie meest gestelde vragen over dit onderwerp, kort beantwoord.
Wat is Greedy Decoding?
Een methode waarbij een AI-model bij elke stap het meest waarschijnlijke woord kiest. Snel en simpel, maar kan tot saaie of herhalende teksten leiden.
Waarom is Greedy Decoding belangrijk?
Stel je voor dat je een verhaal schrijft en bij elk woord kiest voor de allereerste optie die in je opkomt — zonder na te denken over alternatieven. Dat is in essentie greedy decoding.
Hoe wordt Greedy Decoding toegepast?
Wanneer een taalmodel zoals GPT of Claude een tekst genereert, doet het dat woord voor woord (of eigenlijk: token voor token). Bij elke stap berekent het model voor duizenden mogelijke woorden een waarschijnlijkheidsscore: "hoe waarschijnlijk is het dat dit woord hier past?" Greedy decoding pakt simpelweg altijd het woord met de hoogste score. Klaar. Volgende woord.