생성형 인공지능 | ||
{{{#!wiki style="margin:-0px -10px -5px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all" | 텍스트 | [[소설| 소설 ]] NovelAI · AI Dungeon · AI 노벨리스트 |
대화형 | [[챗봇| 챗봇 ]] ChatGPT · Microsoft Copilot · Gemini · CLOVA X · Cue: · Inflection AI · Mistral AI | |
[[언어 모델| 언어모델 ]] GPT-1 · GPT-2 · GPT-3 · GPT-4 · | ||
코드 | [[코드#컴퓨터 소프트웨어| 코드 ]] GitHub Copilot · Devin | |
그림/영상 | [[그림 인공지능| 그림 ]] Midjourney · DALL·E · Artbreeder · NovelAI Image Generation · Stable Diffusion · Gaugan2 · Dream by WOMBO · Adobe Firefly | |
[[영상| 영상 ]] Stable Video · Sora · Lumiere · Runway AI | ||
[[모델링| 모델링 ]] LATTE3D | ||
오디오/소리 | [[음성| 음성 ]] A.I.VOICE · DeepVocal · Voice Engine | |
[[음악| 음악 ]] Suno AI · Stable Audio · Udio · AIVA · SOUNDRAW · Mix.audio · vio.dio | ||
멀티모달 | [[멀티모달 모델| 멀티모달 ]] 삼성 가우스 · Gemini | |
행위/동작 | [[인공지능 로봇| 로봇 ]] Robot Operating Syetem(ROS) · Google RT-X · 피규어 01 · 프로젝트 그루트 | }}}}}}}}} |
Udio 유디오 | |
<colbgcolor=#e30b5d><colcolor=#fff> 출시일 | 베타 2024년 4월 10일 |
기능 | 음악 인공지능 |
지원 언어 | 한국어 지원[1][2] |
사용처 | 자체 웹앱 |
라이선스 | Proprietary SW |
링크 | | | | | | |
[clearfix]
1. 개요
구글 딥마인드 출신 공학자들이 만든 오디오 및 음악 생성 인공지능. 간단한 프롬프트로 음악을 생성할 수 있다.2. 특징
- 현재 사용자 급증으로 인한 서버 과부하 이슈를 겪고 있기는 하지만, 사람이 없는 시간대에는 40초만에 30초짜리 곡 2개를 금방 만들어낼 수 있다. 또한 곡 확장 기능을 이용해 곡의 길이를 더 늘릴 수도 있다.
- 음악 생성 인공지능 중에서는 굉장히 높은 퀄리티를 자랑한다.
3. 구조
구체적으로는 두 단계로 작업을 처리한다.먼저 대형 언어 모델을 사용해 프롬프트를 기반으로 가사를 생성한다.
그 다음 Stability AI의 Stable Audio와 유사한 확산 모델(Diffusion)을 사용하여 음악을 생성한다. #
4. 평가
- 음질
- 전체적인 음질이 매우 깔끔하며, AI가 생성한 듯한 느낌이 들지 않을 때도 많다. 또한 Suno AI에 비해 보컬 갈라짐 현상도 매우 적은 편이다.
- 곡 구성
- 곡의 전개나 흐름이 전혀 이상하지 않고 자연스럽다. 구글의 Music fx와 같은 모델은 음악의 흐름이 중구난방인데에 비해 Udio는 곡의 흐름이 납득이 갈 정도로 자연스럽다는 것을 느낄 수 있다.
5. 반응
- 윌아이엠은 “이것은 완전히 새로운 르네상스이며, 유디오는 이 시대의 창의성을 위한 도구다”라며 “유디오를 사용하면 AI와 상상력을 통해 노래를 존재하게 만들 수 있다”라고 극찬했다. #
- 레딧에는 "완전히 미쳤다" “정말 섬찟할 정도다” “이것이 무섭다고 생각하지 않는다면 당신은 자신에게 거짓말을 하고 있는 것” “작곡가에게는 죽음을 알리는 종소리” 등 놀라워하는 반응이 많다.
6. 기타
- 현재 베타테스트 중으로 한 달에 2000곡을 무료로 생성할 수 있다.
- 자동 저작권 필터를 갖추고 있다.