Dynamic Programming 앞서 MDP라는 이론, 그리고 MDP를 풀기 위한 Bellman equation 이라는 mathematic…
Finite Markov Decision Process 가장 idle하게 RL을 구현하는 방법이다. 가장 기초가 되는 개념인만큼 추후에도 계속…
Family Site