'NeurIPS2020' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2026/05 »
일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Tags more

Archives

Today

Total

관리 메뉴

목록NeurIPS2020 (3)

qcoding

[AI논문리뷰] HiFi-GAN - 주기 패턴 판별기로 사람 수준의 음질을 실시간보다 167배 빠르게 합성한다

논문 HiFi-GAN: Generative Adversarial Networks for Efficient and High Fidelity Speech Synthesis 저자 Jungil Kong, Jaehyeon Kim, Jaekyoung Bae (Kakao Enterprise) 학회/연도 NeurIPS 2020 arXiv 2010.05646 코드 jik876/hifi-gan 데모 Demo Page📄 한 문단 요약HiFi-GAN은 카카오엔터프라이즈가 NeurIPS 2020에 발표한 신경망 보코더다. 핵심 문제 의식은 하나다. "음성은 다양한 주기를 가진 사인파의 합성인데, 기존 GAN 보코더는 이 주기 구조를 제대로 포착하지 못했다." 이를 해결하기 위해 주기(period)를 [2, 3, 5..

AI논문리뷰-음성인식TTS 2026. 5. 1. 10:11

[AI논문리뷰] Glow-TTS - 외부 정렬기 없이 자체 정렬을 학습하는 병렬 음성 합성 모델

논문 Glow-TTS: A Generative Flow for Text-to-Speech via Monotonic Alignment Search 저자 Jaehyeon Kim et al. (Kakao Enterprise & SNU) 학회/연도 NeurIPS 2020 arXiv 2005.11129 데모 Glow-TTS Demo Page📄 한 문단 요약Glow-TTS는 비자동회귀(Non-Autoregressive) 병렬 음성 합성 모델이 겪는 "텍스트-음성 간의 정렬(Alignment) 데이터가 필요하다"는 한계를 해결한 모델이다. 기존 FastSpeech와 같은 모델은 Tacotron 2 같은 외부 교사(Teacher) 모델이 추출한 정렬 정보(Attention map)에 의존해야만 학습이 가능했..

AI논문리뷰-음성인식TTS 2026. 5. 1. 10:11

[AI논문리뷰] HiFi-GAN - 주기 패턴 판별기로 사람 수준의 음질을 실시간보다 167배 빠르게 합성

AI논문리뷰-음성인식TTS 2026. 5. 1. 08:39

Prev 1 Next

목록NeurIPS2020 (3)

qcoding

티스토리툴바