Direct naar inhoud
Alle termenReinforcement Learning & agents

Wat is Goal Setting?

Een methode waarbij je een AI-agent leert om een specifiek doel te bereiken, in plaats van alleen een beloning te maximaliseren. De agent moet zelf uitzoeken welke stappen nodig zijn.

Wat is Goal Setting

Wat is Goal Setting eigenlijk?

Stel je voor dat je een kind leert fietsen. Je kunt twee dingen doen: elke keer een snoepje geven als het een rondje rijdt (beloning per actie), óf je zegt: "Het doel is om bij oma te komen" — en het kind moet zelf uitvogelen welke route het neemt. Dat tweede is Goal Setting.

Bij Goal Setting geef je een AI-agent een specifiek einddoel mee — bijvoorbeeld "zet deze blokken in een toren" of "navigeer naar punt X" — zonder precies voor te schrijven hoe. De agent moet zelf ontdekken welke acties nodig zijn. Dit is anders dan klassiek reinforcement learning, waarbij je vaak na elke kleine stap een beloning geeft.

Het idee komt uit robotica en game-AI, maar wordt steeds relevanter nu AI-systemen complexere taken moeten uitvoeren in de echte wereld.

Hoe werkt het?

Bij traditioneel reinforcement learning krijgt een agent een beloning voor elke goede actie — zoals een hond die een koekje krijgt voor "zit". Maar bij ingewikkelde taken (een robot die een kamer moet opruimen, een drone die een pakketje moet bezorgen) wordt het lastig om voor élke tussenstap een beloning te bedenken.

Met Goal Setting werk je anders:

  • Je definieert een einddoel ("breng dit object naar die tafel")

  • De agent krijgt alleen feedback als het doel bereikt is — of juist niet

  • Tussenliggende acties moet de agent zelf bedenken

  • De agent leert door trial-and-error welke strategieën werken

Denk aan een zelfrijdende auto: in plaats van elke meter sturen te belonen, zeg je: "Het doel is veilig aankomen op adres X." De auto moet zelf bedenken wanneer hij gas geeft, remt of van baan wisselt.

Waarom is dit handig?

Goal Setting lost een groot probleem op: reward shaping — het bedenken van een slimme beloningsstructuur — is vaak ingewikkelder dan de taak zelf. Als je een robot wilt leren om een tafel te dekken, moet je anders voor elke beweging (pak bord, til op, draai, zet neer) een aparte beloning verzinnen. Dat wordt al snel een administratieve nachtmerrie.

Met Goal Setting hoef je alleen te zeggen: "Einddoel = gedekte tafel." De rest zoekt de agent zelf uit. Dit maakt het systeem:

  • Flexibeler — de agent vindt soms oplossingen waar jij niet aan gedacht had

  • Schaalbaar — je kunt makkelijker nieuwe doelen toevoegen zonder het hele beloningssysteem te herschrijven

  • Realistischer — in de echte wereld krijg je ook geen beloning per actie, maar alleen als het eindresultaat klopt

Een voorbeeld uit de praktijk

Een magazijnrobot van een webwinkel moet dozen van punt A naar punt B verplaatsen. Met klassiek reinforcement learning zou je elke centimeter vooruitgang moeten belonen, elke botsing moeten straffen, enzovoort.

Met Goal Setting zeg je: "Doel = doos staat op punt B." De robot probeert duizenden keren verschillende routes, leert van mislukkingen (botst, valt, rijdt verkeerd) en ontdekt uiteindelijk de snelste weg. Sommige robots vinden zelfs shortcuts die menselijke programmeurs niet hadden bedacht.

Hetzelfde principe zie je in game-AI: een personage krijgt als doel "versla de eindbaas", niet "loop drie stappen naar voren, sla twee keer, ontwijkt".

Waar kom je het tegen?

Goal Setting zie je vooral in:

  • Robotica — robots die objecten moeten manipuleren of navigeren (Boston Dynamics, magazijnrobots)

  • Zelfrijdende voertuigen — auto's die een bestemming moeten bereiken

  • Game-AI — personages die complexe missies moeten voltooien (DeepMind's AlphaStar voor StarCraft)

  • Simulatie-omgevingen — OpenAI Gym, MuJoCo, waar onderzoekers nieuwe goal-based methodes testen

  • Huishoudelijke robots — stofzuigers die een kamer moeten schoonmaken, keukenhulpen die ingrediënten moeten pakken

In de onderzoekswereld zie je technieken als Hindsight Experience Replay (HER), waarbij een agent achteraf leert van mislukte pogingen door te doen alsof het falen eigenlijk het doel was.

Wat kun je ermee?

Als je een AI-systeem bouwt dat iets in de fysieke of virtuele wereld moet doen — en je weet wat het eindresultaat moet zijn, maar niet precies hoe — dan is Goal Setting een krachtige aanpak. In plaats van elke stap voor te kauwen, laat je de AI zelf strategieën ontwikkelen.

Dit vraagt wel geduld: de agent moet vaak duizenden keren falen voordat hij succesvol is. Maar eenmaal getraind, kan een goal-based systeem flexibel omgaan met veranderingen in de omgeving — iets wat rigide geprogrammeerde systemen niet kunnen.

FAQ

Veelgestelde vragen over Goal Setting

De drie meest gestelde vragen over dit onderwerp, kort beantwoord.

Wat is Goal Setting?

Een methode waarbij je een AI-agent leert om een specifiek doel te bereiken, in plaats van alleen een beloning te maximaliseren. De agent moet zelf uitzoeken welke stappen nodig zijn.

Waarom is Goal Setting belangrijk?

Stel je voor dat je een kind leert fietsen. Je kunt twee dingen doen: elke keer een snoepje geven als het een rondje rijdt (beloning per actie), óf je zegt: "Het doel is om bij oma te komen" — en het kind moet zelf uitvogelen welke route het neemt. Dat tweede is Goal Setting.

Hoe wordt Goal Setting toegepast?

Bij Goal Setting geef je een AI-agent een specifiek einddoel mee — bijvoorbeeld "zet deze blokken in een toren" of "navigeer naar punt X" — zonder precies voor te schrijven hoe. De agent moet zelf ontdekken welke acties nodig zijn. Dit is anders dan klassiek reinforcement learning, waarbij je vaak na elke kleine stap een beloning geeft.

Deel: