| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
Tags
- 병행성 제어
- Importance sampling
- Soft Actor-Critic
- Off-policy
- 전역 인터프리터 락
- n-step
- Interpreter Lock
- Reinforcement Learning
- 도커 텐서보드 연결
- Few-shot learning
- Global Interpreter Lock
- 온폴리시
- Control variate
- 강화학습
- 인터프리터 락
- MAML
- Maximazation bias
- Double learning
- Actor-Critic
- 통합 개발
- Maximum entropy
- 파이썬 인터프리터 락
- 오프폴리시
- 중요도 샘플링
- Python Interpreter Lock
- Concurrency Control
- Tree backup
- docker tensorboard
- 지속적 개발
- Meta Learning
Archives
- Today
- Total
목록Reward (1)
HakuCode na matata
포스팅에 앞서 이 게시글은 Reference의 contents를 review하는 글임을 밝힌다. 이번 장에서는 강화학습의 개요에 대해 다루어 볼 예정이다. 강화학습의 정의와 핵심 및 구성요소등등 전반적으로 강화학습의 개론정도이고, 구체적인 부분은 이후 이어지는 장에서 살펴보도록 한다. 「강화학습(Reinforcement Learning)이란?」 강화학습(Reinforcement Learning)은 개체가 환경과 상호작용하며 지도 없이 스스로 학습하는 방법을 모티브로 한 기계학습(Machine Learning)을 말한다. 강화학습은 행동주의 심리학 이론들 가운데 하나인 '조작적 조건화'를 기반으로 만들어진 학습법이다. 해당 이론에서 '스키너의 쥐 실험'이 유명한데, 상자 속의 쥐가 실험자가 의도한 행동을 ..
Machine Learning/Reinforcement Learning
2020. 8. 12. 21:32