Reinforcement Learning & agents
Leren door interactie, autonome agents en robotica.
99 termen live — streefgetal 100
99 termen — pagina 1 van 2
A
- A2CReinforcement Learning & agents
Een AI-leermethode waarin een agent leert door uitproberen, waarbij een 'actor' acties voorstelt en een 'critic' beoordeelt hoe goed die acties zijn — zoals een kind dat leert fietsen met een ouder die tips geeft.
- A3CReinforcement Learning & agents
Een manier om AI-agenten sneller te trainen door meerdere kopieën tegelijk te laten leren van verschillende situaties, waarna ze hun kennis bundelen.
- Action-ValueReinforcement Learning & agents
De verwachte 'opbrengst' (beloning) die een AI-agent krijgt als hij in een bepaalde situatie een specifieke actie kiest — de manier waarop de agent leert welke keuze het beste uitpakt.
- Actor-CriticReinforcement Learning & agents
Een AI-leermethode waarbij twee 'hersenhelften' samenwerken: de ene bedenkt acties, de andere beoordeelt of ze slim waren — zo leert de AI steeds beter beslissingen nemen.
- Advantage FunctionReinforcement Learning & agents
Een methode in reinforcement learning die meet hoe veel beter een specifieke actie is dan het gemiddelde. Helpt AI-agenten slimmere keuzes maken door te focussen op acties die écht het verschil maken.
- Agentic AIReinforcement Learning & agents
AI die zelfstandig keuzes maakt en handelingen uitvoert om een doel te bereiken, zoals een slim persoonlijk assistent die je agenda organiseert zonder dat je elk stapje hoeft aan te geven.
- AI ActionReinforcement Learning & agents
Een keuze die een AI-agent op een bepaald moment maakt — zoals 'ga naar links', 'pak dit op' of 'verhoog de prijs met 5%'.
- AI AgentReinforcement Learning & agents
Een AI-systeem dat zelfstandig taken uitvoert, beslissingen neemt en tools gebruikt om een doel te bereiken — zoals een digitale assistent die meerdere stappen voor je zet zonder dat je steeds hoeft in te grijpen.
- AI EnvironmentReinforcement Learning & agents
De virtuele of echte wereld waarin een AI-agent leert door te experimenteren — van een schaakbord tot een simulatie van een fabriek.
- AI ExecutorReinforcement Learning & agents
Het onderdeel van een AI-agent dat daadwerkelijk acties uitvoert — zoals het versturen van een e-mail, het openen van een bestand of het aanroepen van een tool — nadat een ander onderdeel (de planner) heeft bedacht wát er moet gebeuren.
- AI Memory SystemReinforcement Learning & agents
Een systeem waarmee een AI-agent informatie uit eerdere interacties onthoudt en later weer ophaalt — zodat hij leert van ervaringen en context behoudt over meerdere gesprekken of taken heen.
- AI PlannerReinforcement Learning & agents
Een AI-component die een reeks stappen bedenkt om een doel te bereiken — zoals een routeplanner, maar dan voor taken die een AI-agent moet uitvoeren.
- AI PolicyReinforcement Learning & agents
De 'strategie' van een AI-agent: een set regels die bepaalt welke actie de agent kiest in elke situatie. Net zoals jij een beleid hebt voor 'wat doe ik als het regent?' heeft een agent een policy voor 'wat doe ik als ik dit zie?'
- AI RewardReinforcement Learning & agents
Een numeriek signaal dat een AI-agent krijgt na elke actie — een soort 'punten' die aangeven of het goed of fout bezig is. Zo leert de agent wat wel en niet werkt.
- AI StateReinforcement Learning & agents
De huidige situatie of momentopname van de omgeving waarin een AI-agent zich bevindt — zoals de stand van het schaakbord of de positie van een robot in een ruimte.
- Autonomous AgentReinforcement Learning & agents
Een AI-systeem dat zelfstandig beslissingen neemt en taken uitvoert zonder dat iemand elk stapje hoeft aan te sturen — zoals een digitale assistent die zelf leert en handelt.
- Autonomous VehicleReinforcement Learning & agents
Een zelfrijdende auto die zonder menselijke bestuurder kan rijden door sensoren, AI-modellen en beslissystemen te combineren — denk aan Tesla's Autopilot of Waymo's robotaxi's.
B
- Behavior TreeReinforcement Learning & agents
Een soort stroomdiagram dat bepaalt hoe een AI-agent zich gedraagt in verschillende situaties — van simpele robots tot NPC's in games.
- Bellman EquationReinforcement Learning & agents
Een wiskundige regel die een AI-agent helpt kiezen: welke actie levert op lange termijn de meeste beloning op? Centraal in reinforcement learning.
- BootstrappingReinforcement Learning & agents
Een trainingsmethode waarbij een AI-systeem zichzelf verbetert door gebruik te maken van zijn eigen eerdere voorspellingen of output als basis voor nieuwe verbeteringen.
D
- DDPGReinforcement Learning & agents
Een AI-methode waarmee een agent leert beslissingen te nemen in situaties met vloeiende acties, zoals het sturen van een robotarm of het regelen van snelheid — in plaats van simpele ja/nee-keuzes.
- Deep Q-NetworkReinforcement Learning & agents
Een AI-systeem dat leert door trial-and-error, net zoals jij als kind leerde fietsen — vallen, opstaan, en steeds beter inschatten wat werkt en wat niet.
- Digital TwinReinforcement Learning & agents
Een digitale kopie van een echt object, proces of systeem waarmee je virtueel kunt experimenteren voordat je iets in de echte wereld doet — van een fabriek tot je eigen hart.
- Discount FactorReinforcement Learning & agents
Een getal tussen 0 en 1 dat bepaalt hoe belangrijk toekomstige beloningen zijn ten opzichte van directe beloningen, waardoor een AI-agent leert om vooruit te plannen in plaats van alleen op korte termijn te optimaliseren.
- Domain RandomizationReinforcement Learning & agents
Een trainingsmethode waarbij een AI-agent in talloze variaties van dezelfde situatie oefent, zodat het later ook omgaat met situaties die het nog nooit precies zo heeft gezien.
- Double DQNReinforcement Learning & agents
Een verbeterde versie van Deep Q-Learning die voorkomt dat een AI-agent té optimistisch wordt over zijn eigen acties, waardoor hij stabielere beslissingen leert nemen in complexe omgevingen.
- Dueling DQNReinforcement Learning & agents
Een slim ontwerp van reinforcement learning waarbij een AI-agent leert door apart in te schatten 'hoe goed is deze situatie?' en 'welke actie is hier het beste?' — waardoor het sneller leert dan wanneer je alles door elkaar gooit.
E
- Embodied AgentReinforcement Learning & agents
Een AI-systeem dat door een fysiek lichaam (zoals een robot) of een virtuele avatar de wereld ervaart en daarin kan handelen — net zoals jij je omgeving waarneemt en dingen doet.
- Embodied AIReinforcement Learning & agents
AI die in een fysiek lichaam zit — een robot of ander systeem dat kan bewegen, de wereld voelt en ermee interacteert, in plaats van alleen maar tekst of plaatjes te verwerken op een scherm.
- Emergent BehaviorReinforcement Learning & agents
Onverwacht gedrag dat ontstaat wanneer een AI-systeem complexe vaardigheden ontwikkelt die niet expliciet zijn aangeleerd — zoals plotseling kunnen rekenen of vertalen bij voldoende schaal.
- EpisodeReinforcement Learning & agents
Een volledige cyclus van acties waarin een AI-agent van een startpunt naar een eindpunt gaat — zoals één potje van een spel of één keer een taak uitvoeren.
- Episodic MemoryReinforcement Learning & agents
Een AI-geheugensysteem dat specifieke ervaringen of gebeurtenissen opslaat, zodat een agent zich herinnert wat het heeft meegemaakt en daaruit kan leren — net zoals jij je herinnert wat je gisteren hebt gedaan.
- Epsilon-GreedyReinforcement Learning & agents
Een strategie waarbij een AI-agent meestal de beste actie kiest die hij kent, maar af en toe bewust iets nieuws probeert om te leren — zoals een schaakspeler die 9 van de 10 keer zijn beste zet doet, maar af en toe experimenteert.
- Experience ReplayReinforcement Learning & agents
Een techniek waarbij een AI-agent leert van opgeslagen ervaringen uit het verleden, in plaats van alleen van de meest recente situatie — net zoals jij sterker wordt door herhaaldelijk te oefenen.
- ExploitationReinforcement Learning & agents
Een strategie waarbij een AI-agent kiest voor bekende, bewezen acties in plaats van nieuwe mogelijkheden te verkennen — handig voor snelle winst, maar risicovol op lange termijn.
- ExplorationReinforcement Learning & agents
De fase waarin een AI-agent bewust nieuwe dingen probeert in plaats van alleen te doen wat al werkt, zodat hij leert of er betere oplossingen bestaan.
F
- Finite State MachineReinforcement Learning & agents
Een systeem dat op elk moment in één specifieke toestand zit en van toestand wisselt op basis van inputs — zoals een verkeerslicht dat van groen naar oranje springt als de timer afloopt.
- Function CallingReinforcement Learning & agents
Een techniek waarmee AI-modellen zelf programma's en tools kunnen aanroepen — zodat ze niet alleen tekst genereren, maar ook acties uitvoeren zoals agenda's bijwerken of data ophalen.
G
- GAEReinforcement Learning & agents
Een methode om AI-agents te leren door te voorspellen hoe waardevol hun acties zijn, waarbij je niet alleen naar directe beloningen kijkt maar ook naar wat er later nog kan komen.
- Goal SettingReinforcement Learning & agents
Een methode waarbij je een AI-agent leert om een specifiek doel te bereiken, in plaats van alleen een beloning te maximaliseren. De agent moet zelf uitzoeken welke stappen nodig zijn.
- GraspingReinforcement Learning & agents
Een AI-techniek waarbij een robotarm leert objecten vast te pakken door herhaald te oefenen — net zoals een baby leert grijpen door steeds opnieuw te proberen.
H
- Hierarchical PlanningReinforcement Learning & agents
Een aanpak waarbij een AI-agent een groot probleem opbreekt in kleinere deelproblemen, elk met hun eigen doel — net zoals jij een vakantie plant door eerst de grote stappen (waar, wanneer) te bepalen en daarna de details (hotels, vluchten) in te vullen.
- Humanoid RobotReinforcement Learning & agents
Een robot met menselijke vorm — twee armen, twee benen, een hoofd — die door AI leert bewegen en taken uit te voeren. Denk aan robots die dozen tillen, stofzuigen of zelfs gesprekken voeren.
L
M
- ManipulationReinforcement Learning & agents
Het aansturen van objecten in een virtuele of fysieke omgeving door een AI-systeem, zoals een robotarm die een blokje oppakt of een digitale hand die een pen vasthoudt.
- Markov ChainReinforcement Learning & agents
Een systeem dat van de ene toestand naar de andere springt op basis van kansen, zonder geheugen van het verleden — alleen het 'nu' telt.
- Markov Decision ProcessReinforcement Learning & agents
Een wiskundig model waarmee AI-systemen leren beslissen in stappen, door uit te proberen welke actie op elk moment de beste uitkomst oplevert — net als een schaakspeler die vooruitdenkt.
- Model-Based RLReinforcement Learning & agents
Een manier waarop AI leert door eerst een model van de wereld te bouwen en daar virtueel in te oefenen, in plaats van alles in de echte wereld uit te proberen.
- Model-Free RLReinforcement Learning & agents
Een manier waarop AI leert door pure trial-and-error, zonder vooraf te snappen hoe de wereld werkt — zoals een kind dat leert fietsen door gewoon te proberen.
- Monte Carlo MethodReinforcement Learning & agents
Een manier om problemen op te lossen door heel vaak willekeurige scenario's uit te proberen en daaruit te leren wat gemiddeld het beste werkt — zoals je leert pokeren door duizenden potjes te spelen.