Iti0210w13

Allikas: Lambda

14. Nädal

Hüvitisega õppimine ehk stiimulõpe. Q-Learning. [AIMA] 21.3.2, [ARTINT] 12.4-12.5.

Loenguslaidid: PDF

Sissejuhatus Q-õppesse, loe 1. osa lõpuni, järgmiseid osasid pole tarvis.

Reinforcement Learning: Example and Tutorial