반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- pandas
- kaggle
- 전국국밥
- 클론코딩
- 강화학습 기초
- 데이터분석
- 조코딩
- Instagrame clone
- TeachagleMachine
- 딥러닝
- expo
- 크롤링
- 사이드프로젝트
- clone coding
- 카트폴
- 강화학습
- selenium
- ReactNative
- 머신러닝
- 정치인
- python
- FirebaseV9
- App
- redux
- 리액트네이티브
- JavaScript
- Ros
- coding
- React
- 앱개발
Archives
- Today
- Total
목록deep q-learning (1)
qcoding
[강화학습]Cartpole(카트폴) Deep Q-learning (Dqn) 실습
[Deep Q-learning] * 이번실습은 강화학습 실습으로 유명한 Carpole 을 deep q-learning으로 구현해보는 실습을 진행하였다. DQN은 미래에 받을 가치와 현재 가치의 차이를 줄이면 현재의 가치를 최적의 상태로 만들 수 있다는 것을 목표로 기존 강화학습 알고리즘에서 사용하는 q-table을 인공신경망으로 대체 한 것이다. 위와 같이 q-network가 신경망으로 되어있는 데, state를 입력으로 받아 행동가치함수 (q_value)를 출력으로 생성한다. 여기서 state_t 와 state_t+1을 각 입력으로 넣은 Q-network 와 target Q-netwrok의 output인 q_value의 차이를 줄이게 parameter를 학습하여 해당 state에서 행동가치가 가장 높은..
머신러닝 딥러닝
2023. 1. 14. 22:45