반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- 머신러닝
- 카트폴
- 앱개발
- selenium
- 전국국밥
- 조코딩
- JavaScript
- 사이드프로젝트
- python
- 딥러닝
- ReactNative
- React
- FirebaseV9
- 리액트네이티브
- 강화학습 기초
- pandas
- TeachagleMachine
- 데이터분석
- 강화학습
- kaggle
- App
- 크롤링
- clone coding
- Ros
- 정치인
- Instagrame clone
- 클론코딩
- expo
- redux
- coding
Archives
- Today
- Total
목록Value Based (1)
qcoding

* 이번 실습에서는 Actor-Critic 알고리즘을 통해 Mountain Car 문제를 해결해 보는 시간으로 Reinforce 알고리즘을 통해 Mountain Car 문제가 해결되지 않았으므로 이방법을 통해서 해결이 가능한 지 확인해 보는 Policy Based의 연장선이다. Actor-critc은 value / policy 학습을 둘 다 진행하는 것으로 인공신경망을 통해 가치함수와 정책함수를 둘다 근사하는 것이 특징이다. * 결론부터 말하면 Cartpole은 잘되지만, 역시나 Mountain Car은 잘되지 않았다. 이번실습은 아래와 같은 순서로 진행된다. 1. A2C 에 대한 간략한 이론 2. A2C의 알고리즘 구조 3. A2C CartPole / Mountain car 코드 및 리뷰 4. 평가결과..
머신러닝 딥러닝
2023. 2. 11. 16:49