반응형
Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | ||||||
| 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| 9 | 10 | 11 | 12 | 13 | 14 | 15 |
| 16 | 17 | 18 | 19 | 20 | 21 | 22 |
| 23 | 24 | 25 | 26 | 27 | 28 | 29 |
| 30 |
Tags
- GYM
- Instagrame clone
- 머신러닝
- 강화학습 기초
- 딥러닝
- 클론코딩
- 앱개발
- ReactNative
- redux
- 강화학습
- clone coding
- JavaScript
- FirebaseV9
- pandas
- 조코딩
- 데이터분석
- App
- TeachagleMachine
- selenium
- React
- Reinforcement Learning
- 리액트네이티브
- python
- 사이드프로젝트
- coding
- expo
- 전국국밥
- Ros
- kaggle
- 카트폴
Archives
- Today
- Total
목록exploration-exploitation dilemma (1)
qcoding
[강화학습-1] 강화학습이란?
1. 강화학습 개요“강화(Reinforcement)”라는 단어처럼, 강화학습(Reinforcement Learning, RL) 은 행동(액션) 을 취한 뒤 보상(Reward) 을 받고, 그 보상 신호를 토대로 다음 행동 전략(정책, Policy) 을 조금씩 개선해 가는 학습 패러다임입니다. 인간·동물이 시행착오를 통해 배우는 과정을 수학적으로 모델링한 것이 특징이죠.핵심 질문“어떤 행동을 하면 장기적으로 가장 큰 보상을 얻을까?”1-1. 기본 구성 요소구성 요소설명예시환경 Environment에이전트가 상호작용하는 세계체스판, 자율주행 시뮬레이터, 전력망 시뮬레이터상태 State s환경의 현재 정보말의 위치, 자동차의 속도·좌표행동 Action a에이전트가 선택 가능한 움직임말을 한 칸 이동, 가속 페달..
머신러닝 딥러닝
2025. 5. 28. 16:57