Notice
Recent Posts
Recent Comments
Link
반응형
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
Tags
- 데이터분석
- Instagrame clone
- React
- ReactNative
- 클론코딩
- 전국국밥
- 음성합성
- TTS
- DeepMind
- python
- JavaScript
- 앱개발
- 딥러닝
- 사이드프로젝트
- 강화학습
- Ai
- 강화학습 기초
- expo
- Ros
- TeachagleMachine
- selenium
- 머신러닝
- Reinforcement Learning
- 카트폴
- App
- clone coding
- 논문리뷰
- pandas
- FirebaseV9
- coding
Archives
- Today
- Total
목록VITS (1)
qcoding
[AI논문리뷰] VITS - VAE + Flow + GAN으로 사람 수준 음성을 단일 모델에서 직접 합성
논문 Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech 저자 Jaehyeon Kim, Jungil Kong, Juhee Son (Kakao Enterprise) 학회/연도 ICML 2021 arXiv 2106.06103 데모 VITS Demo Page📄 한 문단 요약VITS는 TTS 파이프라인의 두 단계(음향 모델 + vocoder)를 완전히 하나로 합친 첫 번째 실용적 시스템이다. Conditional VAE로 잠재 표현을 학습하고, Normalizing Flow로 prior를 풍부하게 만들고, HiFi-GAN 디코더로 파형을 직접 생성하며, Stochastic Duration ..
AI논문리뷰-음성인식TTS
2026. 5. 1. 09:13