| | |
| <colbgcolor=#2c2d35> 개발 | Dreamtonics |
| <colcolor=#79D825> 유통 | <colbgcolor=#fff,#191919> Dreamtonics,AHS |
| 정식 출시일 | 2024년 7월 30일 |
| 운영 체제 | Windows [1] | macOS [2][3] |
| 언어 | 영어 |
| 유형 | 음성 합성 엔진 |
| 링크 | |
1. 개요
Dreamtonics[4]에서 2024년 7월 30일에 발매한 리얼타임 음성 모핑 소프트웨어이다.실험용으로 소프트웨어를 공개했을 때 신청제로 여러 dtm프로듀서들이 체험 후기를 올렸다
패키지 없이 다운로드만으로 구매한다.
그리고 Synthesizer V에디터와 일부 라이브러리를 포함한 번들이 6종류 존재한다.
1. Dreamtonics Synthesizer V + Vocoflex
2. Dreamtonics Synthesizer V pro + Vocoflex + 라이브러리 2종
- 나탈리, 헤이든
3. Dreamtonics Synthesizer V pro + Vocoflex + 라이브러리 9종
- 케빈, 나탈리, 헤이든, 나인제로, 시이나, 아야메, 웨이슈, 릿치, 에리
4. AHS Synthesizer V pro + Vocoflex
5. AHS Synthesizer V pro + Vocoflex + 라이브러리 2종
- 아야메, 진
6. AHS Synthesizer V pro + Vocoflex + 라이브러리 9종
- 사키, 료, 유우마, 시이나, 아야메, 진, 에리, 릿치, 나인제로
2. 역사
2024년 4월 15일 24시간 후에 개발 중인 Dreamtonics의 제품을 공개하겠다는 트윗이 올라왔다.2024년 7월 30일에 정식 발매를 공표했다
3. 성능
Synthesizer V를 개발했던 Dreamtonics인 만큼, 굉장한 성능을 자랑한다.특히 이 성능은 현존하는 STS 프로그램중 가장 좋은 성능을 자랑한다.
버튼 몇번만으로 목소리가 바뀐다. 여기까지는 그럴 수 있다는 평가가 많으나, 199달러라는 가격이 Synthesizer V랑 연동도 되고 민간인이 1회성으로 구매가 가능하며 현존하는 STS 프로그램중 가장 짧은 대기시간[5]을 자랑한다.
4. 평가
4.1. 긍정적 평가
- 목소리외에 사용
음성 모핑에 초점을 두고 공개를 했었지만, 공개당시 악기에서도 음성을 모핑하는 것이 가능하다는 것을 보여주었다.
- 가창에 사용
단순 대화수준이 아닌, 가창에도 자연스럽게 모핑이 가능하다고 한다.
- Synthesizer V와 사용
Synthesizer V와 동시에 사용하면 Synthesizer V의 기능을 강화할 수 있다고 밝혔다.
덕분에 Synthesizer V로 다양한 음성을 만들 수 있다
- 간편한 인터페이스
음성을 다루는 대부분 소프트웨어는 인터페이스가 복잡하지만, Synthesizer V와 동일하게 심플한 인터페이스를 가지고 있다.
음성의 스타일을 HEX 코드로 표현하여, 색상을 조절하는 것처럼 음성을 조절할 수 있고 HEX 코드를 통해 음성의 스타일을 공유할 수 있다.
4.2. 부정적 평가
- 딥페이크
최초 시연 당시 1분미만의 짧게 녹음된 음성파일[6]로 모핑을 시연했는데, 자연스러운 수준으로 음성 모핑이 되었다.
이로 인해 딥페이크로 사용될 수 있다는 우려가 제기되었다.
- 저작권 문제
딥페이크 문제와 비슷한 이슈이다.
음성 모핑을 통해 다른 사람의 목소리를 모방할 수 있기 때문에 저작권 문제가 발생할 수 있다.
- 비싼 가격
Synthesizer V Studio 2 Pro 에디터가 99$인 데 비해 Vocoflex는 199$로, RVC 기반 AI 음성 합성 기술보다 가성비가 나쁘다고 평가받고 있다.[7]
5. 관련 영상
Vocoflex 소개 영상
DTM Station에서 진행한 Vocoflex 공개 및 시연 영상.[8]
6. 관련 링크
[1] Windows11 권장[2] 11.0+이상 권장[3] Apple Silicon 지원[4] Synthesizer V를 만든 회사이다[5] Low Latency 모드 기준이며 High Quality 모드 역시 0.9초를 넘어가지 않는다.[6] 최소 10초의 녹음파일부터 합성이 가능하다고 한다[7] 그러나 간편성, 성능들을 생각해 보면 위 문단과 같이 가성비라는 평가도 존재한다.[8] 52분 22초부터