'VITS' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2026/05 »
일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Tags more

Archives

Today

Total

관리 메뉴

글쓰기
방명록
RSS
관리

목록VITS (1)

qcoding

[AI논문리뷰] VITS - VAE + Flow + GAN으로 사람 수준 음성을 단일 모델에서 직접 합성

논문 Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech 저자 Jaehyeon Kim, Jungil Kong, Juhee Son (Kakao Enterprise) 학회/연도 ICML 2021 arXiv 2106.06103 데모 VITS Demo Page📄 한 문단 요약VITS는 TTS 파이프라인의 두 단계(음향 모델 + vocoder)를 완전히 하나로 합친 첫 번째 실용적 시스템이다. Conditional VAE로 잠재 표현을 학습하고, Normalizing Flow로 prior를 풍부하게 만들고, HiFi-GAN 디코더로 파형을 직접 생성하며, Stochastic Duration ..

AI논문리뷰-음성인식TTS 2026. 5. 1. 09:13

Prev 1 Next

목록VITS (1)

qcoding

티스토리툴바