나무모에 미러 (일반/밝은 화면)
최근 수정 시각 : 2024-11-29 02:45:39

음성 합성 엔진


{{{#!wiki style="margin: -5px -10px; padding: 10px 0; background-image: linear-gradient(to right, #33CCCC , #00a495)"
음성 합성 엔진
{{{#!wiki style="margin-top:5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="letter-spacing: -.2px; margin:0 -1px -11px; word-break:keep-all"
<tablewidth=100%> 소프트웨어 VOCALOID () · CeVIO () · UTAU · Synthesizer V () · VOICEROID · 보카리나 () · DeepVocal · NEUTRINO · A.I.VOICE · VOICEVOX · ACE Studio · VOICEPEAK · Voice Engine · Vocoflex
악곡 오리지널 곡 (하츠네 미쿠 · 카가미네 린·렌 · GUMI · IA · 시유 · 유니 · 합창) · 프로듀서 · 미디어 믹스 (정식발매)
전당입성 VOCALOID (2007~2010 · 2011~2015 · 2016~2020 · 2021~2025) · CeVIO · Synthesizer V · VOICEVOX · NEUTRINO
전설입성 VOCALOID · CeVIO · UTAU · Synthesizer V · NEUTRINO
신화입성 VOCALOID
랭킹 및 차트 주간 VOCAL Character (1위 목록) · 주간 UTAU 랭킹 1위 · Billboard JAPAN 니코니코 VOCALOID SONGS · VOCALOID 프로듀서 · 오리지널 곡 재생수 순위
반주기 수록곡 한국 노래방 · 일본 가라오케
기타 MikuMikuDance · 오역 · 조교 · 논란 및 사건 사고 · 관련 웹사이트 · 동인설정 · 나무위키 음성 합성 엔진 프로젝트}}}음성 합성 엔진 분류 둘러보기}}}}}}}}}


1. 개요2. 명칭에 대해3. 엔진 목록4. 프로듀서5. 오리지널 곡6. 동인설정7. 미디어 믹스8. 논란 및 사건 사고9. 관련 기업10. 관련 문서

1. 개요

음성 합성 엔진(音聲 合成 Engine)은 인간의 육성 혹은 그와 비슷한 주파수의 합성으로 인공 음성(人口音聲)을 만들 수 있는 소프트웨어를 말한다. 대표적인 예시로는 보컬로이드가 있다.

이런 엔진들로 가동하는 음성 데이터베이스 캐릭터[1]를 음성 합성 엔진으로 뭉뚱그려서 지칭하는 경우가 SNS등지에서 종종 보이는데, 에디터프로그램 자체가 음성 합성 엔진인 것이지, 음성 데이터베이스 캐릭터는 음성 합성 엔진이 아니다.

ai한국어 합성에 대한 소스가 돌아다니는지 각종 상업 음성 합성 엔진에 한국어 추가에 대한 움직임에 대한 떡밥 혹은 실행 움직임 소식이 돌고 있다.

ai한국어 합성이 가장 먼저 도입된건 무료 툴인 diff-svc 이며
아예 한국 기업에서 개발하여 운영 중 인 복스팩토리
24년 12월 20일에 런칭 예정인 아이나우
꽤 오래전부터 연구 개발 중이었던 ACE Studio
1년간의 장기펀딩을 시작하면서 한국어를 포함하겠다 발표했던 maghni ai
지난 24년 8월에 한국어 사전을 넣어둔 보이소나
시몬 토파즈라는 음원을 통해 간접적으로 한국어 추가사실을 알린 Synthesizer V

이런 식으로 비슷한 시기 내로 한국어를 지원할 것 같은 분위기가 있다

2. 명칭에 대해

'음성 합성 엔진'의 사전적 의미에 따르면 모든 종류의 Text to Speech가 이 분류에 속하지만, '음성 합성 엔진 팬덤'(구 보컬로이드 팬덤)에서는 일반적으로는 음성 샘플을 사용한 가창 음성 합성(Singing Voice Synthesize) 중에서도 대체로 이미지 캐릭터가 붙은 것[2]만을 가리킨다. 이렇게 된 것은 당초에 VOCALOID와 가장 인기 있던 라이브러리인 하츠네 미쿠 중심으로 팬덤이 형성되었기 때문이다. 이 당시에는 야마하의 등록 상표였던 VOCALOID가 SVS 전체를 대표하는 대명사로 불렸으나, 하츠네 미쿠의 개발사 크립톤 퓨처 미디어가 VOCALOID로부터 독립하여 자주 제작 엔진 하츠네 미쿠 NT를 발매하였고, 동시기에 Synthesizer VCeVIO 등의 경쟁 상품들이 등장하여 더 이상 VOCALOID가 SVS를 대표하기 어려워졌다. 이로 인해 주간 VOCALOID 랭킹이 주간 VOCAL Character 랭킹으로 이름이 바뀌는 등 VOCALOID에 한정되지 않은 SVS 제품군의 명칭에 대한 논의가 있었고, 한국에서는 '음성 합성 엔진'이라는 다소 포괄적인 명칭으로 정착하였다. 실제로 CeVIO 등 일부 제품군의 경우 SVS이면서 TTS를 겸하고 있는 경우가 있다.

다만 상표의 보통명사화로 간주해서 계속 보컬로이드라는 명칭을 고수하는 사람도 적지 않다.

일본에서는 가성 합성 소프트(歌声合成ソフト) 또는 보카로 소프트(ボカロソフト) 라고 주로 불리며, 음성 합성 소프트(音声合成ソフト)는 마찬가지로 SVS와 TTS를 포괄하는 명칭이다. 영어권에서는 Singing Voice Synthesizer 또는 Vocal Synthesizer[3]라고 하는데, 이쪽은 '보카로 팬덤'과 관계없이 (물론 특성상 보카로 팬덤의 파이가 크긴 하지만) 모든 SVS를 통칭한다.

3. 엔진 목록

4. 프로듀서

파일:상세 내용 아이콘.svg   자세한 내용은 음성 합성 엔진/프로듀서 문서
번 문단을
부분을
참고하십시오.

5. 오리지널 곡

파일:상세 내용 아이콘.svg   자세한 내용은 음성 합성 엔진 오리지널 곡 문서
번 문단을
부분을
참고하십시오.

6. 동인설정

파일:상세 내용 아이콘.svg   자세한 내용은 음성 합성 엔진/동인설정 문서
번 문단을
부분을
참고하십시오.

7. 미디어 믹스

파일:상세 내용 아이콘.svg   자세한 내용은 음성 합성 엔진/미디어 믹스 문서
번 문단을
부분을
참고하십시오.

8. 논란 및 사건 사고

파일:상세 내용 아이콘.svg   자세한 내용은 음성 합성 엔진/논란 및 사건 사고 문서
번 문단을
부분을
참고하십시오.

9. 관련 기업

파일:상세 내용 아이콘.svg   자세한 내용은 분류:음성 합성 엔진/회사 문서
번 문단을
부분을
참고하십시오.

10. 관련 문서


[1] 캐릭터가 없는 라이브러리도 있다. 주로 상업이용이 가능하며 캐릭터가 있는것보다 저렴하여 TTS의 경우 세트로 판매된다[2] 이미지 캐릭터가 붙지 않은 가창 음성 합성의 역사는 VOCALOID보다도 더 오래되었으며, 현재에도 합성 성악은 꾸준히 연구 및 활용되고 있다. 솔로가 아닌 코러스에 한한다면 재현시 요구하는 정밀도가 낮기 때문에 수요도 어느 정도 존재한다. 다만 방송물의 배경음악, 게임 배경음악 등 산업디자인의 요소로서만 주로 활용되며 SVS 그 자체를 가수로서 내세워 상업적 성공을 거둔 예는 하츠네 미쿠 이외에는 극히 적다. 음성 합성 엔진 팬덤에서 취급하는 SVS 음원 중에서 이미지 캐릭터가 붙지 않은 것도 있으며(VY 시리즈) 반대로 TTS에 이미지 캐릭터가 붙어도 취급하지 않는 경우가 있으므로(타입캐스트) 절대적인 요건은 아니다.[3] 한국어와 일본어에서 쓰이는 가창이라는 의미의 '보컬'과 달리 영어의 vocal은 그냥 단순히 '음성의' 라는 뜻이기 때문에 오히려 이 쪽이 모호한 단어이고, 노래소리임을 명확히 할 필요가 있으면 Singing Voice Synthesize라고 해야 한다.