나무모에 미러 (일반/밝은 화면)
최근 수정 시각 : 2024-04-08 15:15:24

Stable Audio


생성형 인공지능
{{{#!wiki style="margin:-0px -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"
유니모달 모델 기반
텍스트 [[소설|
소설
]] NovelAI · AI Dungeon · AI Novelist · GPTRPG
대화형 [[챗봇|
챗봇
]] ChatGPT · Microsoft Copilot · Gemini · CLOVA X · Cue: · Inflection AI · Mistral AI · Grok
[[언어 모델|
언어모델
]] GPT-1 · GPT-2 · GPT-3 · GPT-4 · o1 · LLaMA · Gemma · Claude · Phi · Exaone
코드 [[코드#컴퓨터 소프트웨어|
코드
]] GitHub Copilot · Devin · Phind
이미지 [[그림 인공지능|
그림
]] Midjourney · DALL·E · Artbreeder · NovelAI Image Generation · Stable Diffusion · FLUX.1 · Gaugan2 · Dream by WOMBO · Adobe Firefly · Deep Dream Generator
[[영상 인공지능|
영상
]] Stable Video · Sora · Meta Movie gen · Lumiere · Veo · Runway AI · Luma Dream Machine · Kling AI
[[모델링|
모델링
]] LATTE3D
오디오/소리 [[음성|
음성
]] A.I.VOICE · DeepVocal · Voice Engine
[[음악|
음악
]] Suno · Stable Audio · Udio · AIVA · SOUNDRAW · keeneat · Mix.audio · vio.dio
멀티모달 모델 기반
대화형
+이미지
Exaone 2.0 · Samsung Gauss
+음성/이미지
GPT-4o · GPT-5 · Gemini
+에이전트
Claude 3.5 Sonnet
행위/동작 [[AI 에이전트|
에이전트
]] Apple Intelligence · Google Jarvis
[[인공지능 로봇|
체화
]] Tesla optimus · Google RT-X · Project Gr00t
}}}}}}}}}
스테이블 오디오
Stable Audio
<colbgcolor=#ddd,#010101> 분류 음악 생성 인공지능
개발사 Stability AI
출시일
1.0
2023년 9월 14일
2.0
2024년 3월 3일
버전 2.0
라이선스 Proprietary SW[1]
링크 파일:홈페이지 아이콘.svg | 파일:유튜브 아이콘.svg
1. 개요2. 특징

[clearfix]

1. 개요


Stability AI에서 개발한 음악 생성 인공지능. 최대 3분 길이의 음악을 생성할 수 있다.

2. 특징

텍스트를 입력하거나 오디오를 업로드 한 후 해당 오디오를 바탕으로 원하는 음악을 생성할 수 있다.

트랜스포머 아키텍처와 잠재 확산 모델(LDM)을 적절히 조합하여 효율적으로 학습되었다.
[1] 2.0 모델 기준, 향후 오픈소스 모델도 공개될 예정이다.