으악 엄청 밀렸다 .. 하지만 나의 게으름 때문은 아니지. (사실 맞는 듯;) 매주 스터디 세미나가 있다보니 정신없이 흘러가서 복습할 시간이 없어서 못썼다 ㅠㅠ 엄청난 TMI이지만 난 이해력이 좀 느린 편이라 ... 남들보다 배로 노력하는 '노력파'다 ... ㅎ 일주일에 세 챕터.. 나한텐 모자르다 ㅠㅠ 그래서 복습하면서 글 쓸 시간이 없어서 못썼는데 이번주가 강화학습 마지막 스터디라서 슬슬 다시 써보려고 한당. .. .. . .. 근데 나 그래도 어느정도 잘 적응한 듯? 헤헷 세번째는 Bellman Equation 이다. 앞에서 나온 state value와 action value값을 구하기 위한 식이 Bellman Equation인데 이는 또 Bellman Expectation Equation과 Bel..