반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- clone coding
- python
- React
- 강화학습 기초
- 크롤링
- JavaScript
- 리액트네이티브
- ReactNative
- 딥러닝
- coding
- 정치인
- redux
- selenium
- 앱개발
- FirebaseV9
- Instagrame clone
- App
- Ros
- expo
- 카트폴
- pandas
- 데이터분석
- 전국국밥
- 머신러닝
- 조코딩
- 강화학습
- 사이드프로젝트
- kaggle
- TeachagleMachine
- 클론코딩
Archives
- Today
- Total
목록Mountain Car (1)
qcoding

* 이번에 진행할 학습은 Policy Gradient 방법의 기본적인 Reinforce 알고리즘을 통해 Cartpole 문제를 해결하는 것이다. 이번글에서 정리할 주된 내용은 Policy Gradient를 구현하고, Catpole 문제를 해결하는 코드와 Mountain Car 문제에 적용하였을 때, 문제가 해결되지 않았는 데 그 이유를 한번 고민해보는 과정이다. 카트폴에 대한 문제 이해는 이전에 썻던 글을 참고 하면 도움이 될 것 같다. 2023.01.14 - [머신러닝 딥러닝] - [강화학습]Cartpole(카트폴) Deep Q-learning (Dqn) 실습 [강화학습]Cartpole(카트폴) Deep Q-learning (Dqn) 실습 [Deep Q-learning] * 이번실습은 강화학습 실습으로..
머신러닝 딥러닝
2023. 2. 5. 10:41