'Off-policy' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

@tai_haku's_Github
@tai_haku's_Workspace

« 2025/06 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Tags more

Archives

Today

Total

관리 메뉴

글쓰기
방명록
RSS
관리

목록Off-policy (1)

HakuCode na matata

하쿠's 강화학습 :: [Ch. V] Monte Carlo Methods

포스팅에 앞서 이 게시글은 Reference의 contents를 review하는 글임을 밝힌다. 「Monte Carlo Method(몬테카를로 방법)」 이번 포스트의 주제는 'Monte Carlo Method(몬테카를로 방법, 이하 MC)'이다. 앞선 포스트에서 살펴보았듯, 강화학습의 문제를 제공되는 정보의 양을 기준으로 그 해결법에 대해 2가지 분류를 했었다. - 환경정보에 대해 완벽히 안다(Model Based) = Dynamic Programming(DP) = Planning - 환경정보에 대해 일부만 안다(Model Free) = Reinforcement Learning(RL) = Learning 앞서 알아본 DP는 정보를 온전히 다 안다는 전제하에 계획을 세우는 계획법(Planning)으로서 분..

Machine Learning/Reinforcement Learning 2020. 10. 4. 14:36

Prev 1 Next

목록Off-policy (1)

HakuCode na matata

티스토리툴바