Hakemistot

vahvistusoppiminen

en reinforcement learning; RL

määritelmä
koneoppiminen, jossa ohjelma oppii fyysisessä tai virtuaalisessa ympäristössä tekemiensä toimintojen seurauksista saamansa palautteen avulla

huomautus
Vahvistusoppimisessa oppiminen tapahtuu tyypillisesti yrityksen ja erehdyksen kautta: agentti (esimerkiksi robotti) suorittaa erilaisia toimintoja ja saa toiminnastaan joko positiivista tai negatiivista palautetta, jonka pohjalta agentin taustalla oleva ohjelma oppii ja pyrkii muuttamaan toimintaansa siten, että se johtaa positiiviseen palautteeseen. Palaute voi olla esimerkiksi numeerinen arvo, joka kertoo, kuinka hyvin agentti on suorittanut jonkin toiminnon.

Vahvistusoppimista hyödynnetään esimerkiksi itseohjautuvissa autoissa ja robotiikassa.

Käsitejärjestelmäkaavio: Tekoäly

Lähde: Tietotekniikan termitalkoot, 2025-04-23

Kommentit eivät tule näkyville julkisesti!
Nimi:
Sähköposti:
Palaute: