Son's Notation

라벨이 Q-Learning인 게시물 표시전체 보기

Sutton and Barto

[강화학습] 4. Monte Carlo Methods

손쓰 12월 02, 2020

Monte Carlo Methods (MC) 앞서 MDP 에서는 environment의 dynamics 를 정확히 알고 있을 때 Bellman…

Temporal Difference Learning

손쓰 10월 22, 2020

Reinforcement Learning 앞 글에서 Markov Decision Process를 다루었다. 조사해보니 Markov Proces…