반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- Ros
- 앱개발
- 크롤링
- clone coding
- ReactNative
- TeachagleMachine
- coding
- 사이드프로젝트
- kaggle
- 클론코딩
- redux
- FirebaseV9
- 딥러닝
- pandas
- 카트폴
- 데이터분석
- 강화학습
- selenium
- 정치인
- 강화학습 기초
- App
- 리액트네이티브
- React
- JavaScript
- python
- expo
- Instagrame clone
- 머신러닝
- 전국국밥
- 조코딩
Archives
- Today
- Total
목록carpole (1)
qcoding
[강화학습]Cartpole(카트폴) Deep Q-learning (Dqn) 실습
[Deep Q-learning] * 이번실습은 강화학습 실습으로 유명한 Carpole 을 deep q-learning으로 구현해보는 실습을 진행하였다. DQN은 미래에 받을 가치와 현재 가치의 차이를 줄이면 현재의 가치를 최적의 상태로 만들 수 있다는 것을 목표로 기존 강화학습 알고리즘에서 사용하는 q-table을 인공신경망으로 대체 한 것이다. 위와 같이 q-network가 신경망으로 되어있는 데, state를 입력으로 받아 행동가치함수 (q_value)를 출력으로 생성한다. 여기서 state_t 와 state_t+1을 각 입력으로 넣은 Q-network 와 target Q-netwrok의 output인 q_value의 차이를 줄이게 parameter를 학습하여 해당 state에서 행동가치가 가장 높은..
머신러닝 딥러닝
2023. 1. 14. 22:45