나무모에 미러 (일반/밝은 화면)
최근 수정 시각 : 2024-04-21 02:46:16

언어 모델


생성형 인공지능
{{{#!wiki style="margin:-0px -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"
텍스트 [[소설|
소설
]] NovelAI · AI Dungeon · AI 노벨리스트
대화형 [[챗봇|
챗봇
]] ChatGPT · Microsoft Copilot · Gemini · CLOVA X · Cue: · Inflection AI · Mistral AI
[[언어 모델|
언어모델
]] GPT-1 · GPT-2 · GPT-3 · GPT-4 · GPT-5 · LLaMA · Gemma · Claude
코드 [[코드#컴퓨터 소프트웨어|
코드
]] GitHub Copilot · Devin
그림/영상 [[그림 인공지능|
그림
]] Midjourney · DALL·E · Artbreeder · NovelAI Image Generation · Stable Diffusion · Gaugan2 · Dream by WOMBO · Adobe Firefly
[[영상|
영상
]] Stable Video · Sora · Lumiere · Runway AI
[[모델링|
모델링
]] LATTE3D
오디오/소리 [[음성|
음성
]] A.I.VOICE · DeepVocal · Voice Engine
[[음악|
음악
]] Suno AI · Stable Audio · Udio · AIVA · SOUNDRAW · Mix.audio · vio.dio
멀티모달 [[멀티모달 모델|
멀티모달
]] 삼성 가우스 · Gemini
행위/동작 [[인공지능 로봇|
로봇
]] Robot Operating Syetem(ROS) · Google RT-X · 피규어 01 · 프로젝트 그루트
}}}}}}}}}


1. 개요2. 구조3. 개발 방식
3.1. 폐쇄형 vs 오픈소스3.2. 데이터셋 vs 아키텍처
4. 경쟁력5. 주요 언어모델6. 비판 및 문제점

[clearfix]

1. 개요

언어 모델(LM, Language Model)은 입력값(자연어, 보통은 사용자의 문장)을 기반으로 통계학적으로 가장 적절한 출력값을 출력하도록 학습된 모델이다. 규모가 더욱 커다란 언어모델(LM)을 LLM(Large Language Models)이라고 부르는데, 매개변수 규모가 막대한, 후술할 모델들이 이에 해당한다.

2. 구조

크게 통계학 기반과 인공신경망 기반으로 나눠 볼 수 있다. 현 시점에서는 후자가 더 대중적으로 쓰인다. 인공신경망 중에서도 비지도학습[1] 방식의 트랜스포머 아키텍처를 기반으로 알고리즘이 구현되어 있다.

텍스트(자연어), 이미지(2차원), 포인트 클라우드(3차원), 오디오 등 여러 포맷의 대규모 데이터셋을 모아서 토큰화시키고 멀티모달을 구축하여 학습시키면, 파운데이션 모델이 구축된다. 이후 분야별로 별도의 파인튜닝을 거친 뒤 프롬프트를 입력하면 추론을 통해 여러 종류의 출력을 지원하는 생성형 인공지능 서비스를 만들 수 있게 된다. 모델 개발사는 본인이 서비스를 직접 구축하는 방법 외에도 서드파티 개발사에 API를 지원하여 수익을 창출할 수 있다.[2]

2023년 ChatGPT의 성공으로 인하여 큰 인기를 얻은 바 있으며, 산업계 뿐만 아니라 학계에서도 가장 화두가 되어 매일 팔로업하기 힘들 정도로 수 많은 논문들이 쏟아져 나오고 있는 분야이다.

3. 개발 방식

3.1. 폐쇄형 vs 오픈소스

구글OpenAI가 연구 목적 외의 기반 기술을 공개하지 않는 폐쇄형 노선을 선택하며 업계를 선두하고 있는 반면, 비교적 후발 주자라고 평가받는 메타오픈소스로 기반 기술을 공개하여 Vicuna, Alpaca 등 여러 파생형 모델들의 출시를 간접적으로 도왔다. 심지어 LLaMA-2는 상업용으로도 사용 가능한 라이선스일 정도로 이례적이라 큰 이목을 끌었다.[3] 또한 데이터브릭스가 인수한 모자이크ML은 단돈 25만 달러에 데이터를 외부에 보내지 않고 구축 가능한 기업용 언어모델을 위주로 보안성을 홍보하고 있다. 해당 산업에는 수요만큼 전문 인력의 공급이 많지 않은 탓에, 인재 영입에는 폐쇄형이 유리하고 생태계 확장에는 오픈형이 유리하다는 장단점이 있다.

한편 Apple도 JAX를 개량한 AJAX 프레임워크를 통하여 개별 노드들이 사용하기에 적합한 작은 규모의 모델인 AppleGPT를 출시할 예정이라는 소문이 돌고 있다. 이미 앞선 빅테크 기업들이 업계를 선점한 탓에, 진입 시기가 이미 늦었다. 또한 애플은 하드웨어 매출이 주력인 기업이기 때문에, 뉴럴엔진을 통해 간단한 기계학습 추론이 가능한 것 처럼 모델도 개별 노드 단위로 간소화한다면 하드웨어 구매 매력도가 높아질 수 있다는 장점이 있다.

3.2. 데이터셋 vs 아키텍처

아직까지 성숙화된 산업 분야가 아니다 보니, 효율성이 좋고 강력한 성능의 대규모 모델 구축 방법론에 있어서 데이터의 퀄리티가 중요하다는 주장과 모델 자체의 아키텍처가 중요하다는 의견이 대립하고 있는 상황이다.

4. 경쟁력

파일:B6471631-FAB3-485E-8506-83441FDB5FFC.jpg
2022년까지는 미국 등 압도적으로 영어를 기반으로 학습한 모델들 위주였으나, 2023년 들어서 ChatGPTiOS 앱이 다개국어로 런칭되고 Bard 역시 영어 외에 일본어와 한국어를 우선적으로 런칭하는 등 비영어권을 대상으로 한 경쟁이 매우 거세지고 있다. 중국에서는 바이두, 한국에서는 네이버 등이 자체적 언어모델을 개발하였다. 특히 중국은 다른 국가와 달리, 당국 주도 펀딩을 통해 산학연의 연구가 수직화되는 케이스가 대부분이기 때문에 개발 속도에 큰 진전을 보이고 있다. 또한 인구도 많은데다 서방과 달리 사생활 침해, 데이터 프라이버시 등에 대한 반발이 적은 편이라 퀄리티 높은 데이터 수집에 유리한 편이다.

API플러그인을 통한 생태계 형성과 유료판매, 자체 소프트웨어 출시 등 아직까지 시장이 초창기인데도 수익화와 생태계 확장 가능성이 무궁무진하여 여러 업체들이 뛰어 들고 있다.

4.1. 유니콘 기업

파일:292F9E1F-F6E5-441A-A6AB-F90E1A741184.webp
인공지능 유니콘 기업 목록 [6]
사명 기업 가치(USD) 비고
OpenAI 290억 [7]
Anthropic 45억 [8]
HuggingFace 45억 [9]
Inflection AI 40억 [10]
Cohere 22억 [11]
Lightricks 18억 [12]
Runway ML 15억 [13]
Jasper AI 15억 [14]
Replit AI 12억 [15]
Adept AI 10억 [16]
Character.AI 10억 [17]
Stability AI 10억 [18]
Glean 10억 [19]
Synthesia AI 10억 [20]
Typeface AI 10억 [21]

5. 주요 언어모델

6. 비판 및 문제점


[1] 언어학적으로 매우 연관이 깊기 때문에, 모델 학습할 때도 국어 문제 풀 때 같이 문장의 빈칸 채우기, 앞뒤 문장 연관성 등등 학습 기법들이 채용됐다.[2] 예를 들어서 OpenAIGPT-4를 일부 파트너들에 한정하여 독점 공급하고 있다. Quora의 Poe라는 챗봇의 유로 버전은 GPT-4를 기반으로 동작한다.[3] 파일:634CE7C6-949F-4C56-8761-96A172702207.jpg[4] 조지 호츠, 무스타파 슐레이만 등 이러한 의견에 일치를 보이는 경우가 많아지고 있다.[5] 실제로 GPT-3.5를 기반으로 하는 ChatGPTGPT-4를 기반으로 하는 유료버전의 비교를 통해, 더 이상 사이즈에 비례하여 퍼포먼스가 향상되지 않는다는 것을 체감해볼 수 있다. 또한 사이즈가 훨씬 작은 타 생성형 서비스들도 ChatGPT에 크게 뒤지지 않는 퍼포먼스를 보여주고 있다[6] 2023년 8월 기준으로 15곳의 유니콘 기업이 존재한다.[7] 대화형 인공지능 플랫폼.[8] 대화형 인공지능 플랫폼.[9] 머신러닝 라이브러리 플랫폼.[10] 대화형 인공지능 플랫폼.[11] 대화형 인공지능 플랫폼.[12] 이스라엘의 인공지능 기반 영상 및 사진 편집 플랫폼. 페이스튠 앱을 개발했다.[13] 인공지능 기반 영상 생성 플랫폼.[14] 인공지능 작가.[15] 프로그래밍 협업 플랫폼.[16] 언어모델 API 제공 업체.[17] 인공지능 컴패니언 플랫폼.[18] 그림 인공지능 플랫폼.[19] 연구용 리서치 플랫폼.[20] 텍스트 투 이미지/비디오 플랫폼.[21] 어도비 직원들이 설립한 컨텐츠 생성 솔루션 업체.[22] 2023년 4월부터 아마존 웹 서비스를 통해 제공하고 있다.[23] 단돈 25만 달러로 기업별 맞춤 LLM 구축이 가능하다고 한다. 또한 사내 데이터를 외부에 공개하지 않고 자체적으로 구축하는 방식이라 보안성이 강하다.[24] 기업 맞춤 프라이빗 플랫폼이다.[25] AWS, Azure, GCP.[26] 2010년대 들어서는 대부분의 기업들이 온프레미스 외에 클라우드 서비스를 병행하거나 클라우드만 사용하는 등 사용량이 급증하고 있는데, 이들 3사가 데이터를 영리적으로 활용할 것이라는 불안 요소가 깔려있는 것이다.[27] 가장 유명한 생성형 인공지능인 ChatGPT가 해당 분야에서 상당히 떨어지는 능력치를 보여준다.[28] 소셜 미디어와 검색엔진 같은 경우에도 맞춤형 디지털 광고라는 수익모델을 만들기 전까지는 꽤나 오랜 기간 해당 기술의 파급력이나 범용도 대비 수익성이 좋지 못했다.