| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
- 강화학습
- DeepMind
- 카트폴
- selenium
- python
- JavaScript
- 강화학습 기초
- 클론코딩
- Instagrame clone
- TTS
- 앱개발
- FirebaseV9
- Reinforcement Learning
- 머신러닝
- ReactNative
- TeachagleMachine
- 음성합성
- expo
- Ai
- 논문리뷰
- 전국국밥
- React
- App
- clone coding
- 딥러닝
- 사이드프로젝트
- pandas
- 데이터분석
- Ros
- coding
- Today
- Total
목록NeurIPS2020 (3)
qcoding
논문 HiFi-GAN: Generative Adversarial Networks for Efficient and High Fidelity Speech Synthesis 저자 Jungil Kong, Jaehyeon Kim, Jaekyoung Bae (Kakao Enterprise) 학회/연도 NeurIPS 2020 arXiv 2010.05646 코드 jik876/hifi-gan 데모 Demo Page📄 한 문단 요약HiFi-GAN은 카카오엔터프라이즈가 NeurIPS 2020에 발표한 신경망 보코더다. 핵심 문제 의식은 하나다. "음성은 다양한 주기를 가진 사인파의 합성인데, 기존 GAN 보코더는 이 주기 구조를 제대로 포착하지 못했다." 이를 해결하기 위해 주기(period)를 [2, 3, 5..
논문 Glow-TTS: A Generative Flow for Text-to-Speech via Monotonic Alignment Search 저자 Jaehyeon Kim et al. (Kakao Enterprise & SNU) 학회/연도 NeurIPS 2020 arXiv 2005.11129 데모 Glow-TTS Demo Page📄 한 문단 요약Glow-TTS는 비자동회귀(Non-Autoregressive) 병렬 음성 합성 모델이 겪는 "텍스트-음성 간의 정렬(Alignment) 데이터가 필요하다"는 한계를 해결한 모델이다. 기존 FastSpeech와 같은 모델은 Tacotron 2 같은 외부 교사(Teacher) 모델이 추출한 정렬 정보(Attention map)에 의존해야만 학습이 가능했..
논문 HiFi-GAN: Generative Adversarial Networks for Efficient and High Fidelity Speech Synthesis 저자 Jungil Kong, Jaehyeon Kim, Jaekyoung Bae (Kakao Enterprise) 학회/연도 NeurIPS 2020 arXiv 2010.05646 코드 jik876/hifi-gan 데모 Demo Page📄 한 문단 요약HiFi-GAN은 카카오엔터프라이즈가 NeurIPS 2020에 발표한 신경망 보코더다. 핵심 문제 의식은 하나다. "음성은 다양한 주기를 가진 사인파의 합성인데, 기존 GAN 보코더는 이 주기 구조를 제대로 포착하지 못했다." 이를 해결하기 위해 주기(period)를 [2, 3, 5..