Notice
Recent Posts
Recent Comments
Link
반응형
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
Tags
- ReactNative
- Ros
- TTS
- 강화학습
- 강화학습 기초
- JavaScript
- expo
- App
- Ai
- 논문리뷰
- DeepMind
- Reinforcement Learning
- React
- clone coding
- 앱개발
- 머신러닝
- python
- coding
- Instagrame clone
- 사이드프로젝트
- 데이터분석
- 카트폴
- FirebaseV9
- 클론코딩
- 음성합성
- TeachagleMachine
- pandas
- selenium
- 전국국밥
- 딥러닝
Archives
- Today
- Total
목록DreamerV2 (1)
qcoding
[AI논문리뷰-강화학습] DreamerV2 - 이산 잠재 변수와 KL 균형으로 Atari 55개 게임을 인간 수준으로 정복한 세계 모델 RL
논문 Mastering Atari with Discrete World Models 저자 Hafner et al. (Google Research / DeepMind) 학회/연도 ICLR 2021 arXiv 2010.02193📄 한 문단 요약DreamerV2는 ICLR 2021에 발표된 Dreamer의 직접 후속으로, 연속 잠재 변수(Gaussian) 대신 32×32 범주형(categorical) 잠재 변수와 KL 균형(KL balancing)을 도입해 이산 행동 공간인 Atari로 확장했다. 단일 GPU에서 200M 환경 스텝, 468억 개의 상상 상태를 학습해 55개 Atari 게임의 게이머 정규화 중간값에서 Rainbow를 능가하고 인간 수준 성능을 달성했다. 연속 제어 전용이었던 Dreame..
AI논문리뷰-강화학습
2026. 5. 2. 09:58