반응형
Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |
Tags
- App
- 전국국밥
- JavaScript
- selenium
- 클론코딩
- 앱개발
- redux
- pandas
- 리액트네이티브
- expo
- 카트폴
- coding
- clone coding
- Ros
- 강화학습 기초
- ReactNative
- 조코딩
- 딥러닝
- React
- 강화학습
- Instagrame clone
- kaggle
- FirebaseV9
- python
- Reinforcement Learning
- GYM
- 머신러닝
- 데이터분석
- TeachagleMachine
- 사이드프로젝트
Archives
- Today
- Total
목록function approximation (1)
qcoding
[강화학습-7] 함수 근사 (Function Approximation)
7. 함수 근사 (Function Approximation) 무한/거대한 상태 공간에서는 테이블($V(s)$ 또는 $Q(s,a)$)에 값을 저장할 수 없습니다. 대신 가치 함수를 어떤 파라미터 벡터로 근사해야 합니다.7-1. 왜 함수 근사가 필요한가? 차원의 저주 – 상태 수가 지수적으로 폭발. 일부 상태는 평생 한 번도 방문하지 않을 수 있음 → 테이블 학습 불가. 근사는 일반화와 압축을 동시에 제공.7-2. 선형 vs 비선형 근사종류모델장점단점 선형 $$\hat Q(s,a;\mathbf{w})=\mathbf{w}_a^\top \phi(s)$$ 빠른 학습, 이론적 수렴 보장, 구현 단순 표현력 제한 (복잡 패턴 어려움) 비선형(NN, RBF, 결정트리 등) $$\hat Q=f_..
머신러닝 딥러닝
2025. 5. 28. 17:22