반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 강화학습 기초
- pandas
- 앱개발
- 사이드프로젝트
- 크롤링
- React
- 클론코딩
- 머신러닝
- kaggle
- 전국국밥
- expo
- 데이터분석
- JavaScript
- redux
- Ros
- selenium
- 리액트네이티브
- coding
- App
- 카트폴
- 강화학습
- TeachagleMachine
- ReactNative
- FirebaseV9
- 딥러닝
- python
- 정치인
- 조코딩
- clone coding
- Instagrame clone
Archives
- Today
- Total
목록정책기반 (1)
qcoding
[강화학습]정책기반 강화학습_Policy Gradient_Reinforce_Cartpole
* 이번에 진행할 학습은 Policy Gradient 방법의 기본적인 Reinforce 알고리즘을 통해 Cartpole 문제를 해결하는 것이다. 이번글에서 정리할 주된 내용은 Policy Gradient를 구현하고, Catpole 문제를 해결하는 코드와 Mountain Car 문제에 적용하였을 때, 문제가 해결되지 않았는 데 그 이유를 한번 고민해보는 과정이다. 카트폴에 대한 문제 이해는 이전에 썻던 글을 참고 하면 도움이 될 것 같다. 2023.01.14 - [머신러닝 딥러닝] - [강화학습]Cartpole(카트폴) Deep Q-learning (Dqn) 실습 [강화학습]Cartpole(카트폴) Deep Q-learning (Dqn) 실습 [Deep Q-learning] * 이번실습은 강화학습 실습으로..
머신러닝 딥러닝
2023. 2. 5. 10:41