Son's Notation

라벨이 Value Iteration인 게시물 표시전체 보기

Value Iteration

[강화학습] 3. Dynamic Programming

손쓰 12월 02, 2020

Dynamic Programming 앞서 MDP라는 이론, 그리고 MDP를 풀기 위한 Bellman equation 이라는 mathematic…

Value Iteration

손쓰 12월 02, 2020

Finite Markov Decision Process 가장 idle하게 RL을 구현하는 방법이다. 가장 기초가 되는 개념인만큼 추후에도 계속…