{{{#!wiki style="margin:0 -10px -5px" {{{#000,#fff {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-6px -1px -11px" {{{#000,#e5e5e5 | 제품군 | |
서비스 | ChatGPT · OpenAI(인공지능) | |
모델 | GPT-1 · GPT-2 · GPT-3(GPT-3.5) · GPT-4(GPT-4 Turbo · GPT-4o · GPT-4o mini) · GPT-5(개발 중) o1(o1-preview · o1-mini) | |
DALL·E · Codex · CLIP · Whisper · Voice Engine · Sora · SearchGPT | ||
관련 인물 | ||
일론 머스크 · 샘 올트먼 · 미라 무라티 · 일리야 수츠케버 · 안드레 카파시 · 그렉 브록만 · 다리오 아모데이 | ||
관련 기업 | ||
마이크로소프트 |
ChatGPT 관련 틀 | |||||||||
|
ChatGPT Generative Pre-trained Transformer | |
<colbgcolor=#74aa9c><colcolor=#fff> 분류 | LLMs 대화형 인공지능 |
개발사 | OpenAI |
서비스 | 부분적 유료 |
출시일 | 2022년 11월 30일 (초기 베타) 2023년 5월 24일 (안정화 베타) |
PC | macOS[1] | Windows[2] |
모바일 | Android[3] | iOS[4] | iPadOS[5] | visionOS[6] |
기반 | |
언어 | 영어 등[12] |
사용자 | 약 2억 명[13] (2023년 2월 / 추정치) |
구독자 | 약 100만 명 (2023년 2월 / 추정치) |
링크 | [14] | [15] | | | |
1. 개요2. 특징
2.1. 프롬프트 입력시 인터페이스
3. 등장 배경4. 초기 공식 가이드라인5. 기능5.1. 무료로도 제공되는 기능5.2. ChatGPT Plus 가입자 한정 기능
6. 의의7. 한계8. 문제점9. 활용10. 이슈11. 여담12. 관련 문서5.2.1. GPT-4, GPT-4o5.2.2. GPT-4 부가 기능 설명5.2.3. OpenAI o15.2.4. 고급 음성 모드(Alpha)5.2.5. ChatGPT Search
5.3. 더 이상 제공되지 않는 기능5.4. 탈옥 시도 방지[clearfix]
1. 개요
OpenAI에서 개발한 GPT를 기반으로 하는 대화형 인공지능 서비스이다.ChatGPT[16]에게 물어본 ChatGPT의 GPT약자에 대한 한국어 답변[17]
GPT에서 "GPT"는 Generative Pre-trained Transformer의 약자입니다.
Generative: 새롭고 유의미한 텍스트를 생성하는 능력을 의미해요. ChatGPT는 사용자가 질문하거나 대화할 때 필요한 답변이나 이야기를 생성하죠.
Pre-trained: 사전 학습된 모델이라는 뜻으로, ChatGPT는 엄청난 양의 텍스트 데이터로 미리 학습되어 있어, 새로운 상황에서도 적절하게 답변할 수 있습니다.
Transformer: "Transformer"는 AI 모델의 아키텍처 유형으로, 텍스트에서 문맥을 이해하고 처리하는 데 매우 효과적입니다. GPT는 이 구조를 기반으로 개발되어 자연스러운 언어 생성이 가능해요.
즉, GPT는 인간처럼 대화하고 다양한 주제에 답변할 수 있도록 설계된 인공지능 모델의 이름이랍니다!
Generative: 새롭고 유의미한 텍스트를 생성하는 능력을 의미해요. ChatGPT는 사용자가 질문하거나 대화할 때 필요한 답변이나 이야기를 생성하죠.
Pre-trained: 사전 학습된 모델이라는 뜻으로, ChatGPT는 엄청난 양의 텍스트 데이터로 미리 학습되어 있어, 새로운 상황에서도 적절하게 답변할 수 있습니다.
Transformer: "Transformer"는 AI 모델의 아키텍처 유형으로, 텍스트에서 문맥을 이해하고 처리하는 데 매우 효과적입니다. GPT는 이 구조를 기반으로 개발되어 자연스러운 언어 생성이 가능해요.
즉, GPT는 인간처럼 대화하고 다양한 주제에 답변할 수 있도록 설계된 인공지능 모델의 이름이랍니다!
2. 특징
OpenAI 플랫폼 회원가입 후, 무료 혹은 유료 구독제(ChatGPT Plus)로 이용할 수 있으며, 회원가입을 하고, 채팅을 하듯이 챗봇에 질문을 입력하는 것만으로 AI를 이용할 수 있다. 사실 어떤 유형의 글을 입력해도 이에 맞는 답변이 생성되는 시도가 이루어진다. 스마트폰으로도 OpenAI 플랫폼에 들어가면 이용할 수 있다. 여기서 입력하는 대화문을 '프롬프트(Prompt)'라고 하며, 이에 대한 AI의 답변 생성을 두고 '응답(Response)'이 생성된다고 표현한다. 각 대화방의 이름은 대화를 하자마자 첫 질문과 답변에 맞게 생성되지만 언제든지 변경할 수 있다.무료 버전으로도 GPT-4o mini[18] 모델을 이용할 수 있으며, 플러스에 해당하는 유료 버전은 GPT-4 모델과 GPT-4o, GPT-4o mini에 해당하는 기본 모델을 이용할 수 있다. 한국 시간 2024년 9월 13일부터는 o1-preview, o1-mini라는 작문 관련 능력은 종전과 유사하나 논리적 추론 능력이 매우 향상된 모델을 각각 1주일에 30개 메시지, 50개 메시지 제한을 둔 채로 Plus 가입자 한정으로 제공하기 시작했다. 이용 제한은 완화되는 추세며, 현재도 처음의 제한보다는 완화되었다. (미국 시간 2024년 9월 17일부터 preview는 주당 50개, mini는 하루 50개)
처음 이 서비스에 대한 소문이 있었을 때 문제가 되던 GPT-3.5가 제공하던 엉터리 답변은 더 이상 등장하지 않는다. 오류나 불편함은 여전히 미묘한 부분에서 발생하고 있으나 출시 당시보다는 답변의 정확도가 상당히 높아진 상황이다. 현재도 국제적으로 알려지지 않았을 매우 지엽적인 사실을, 검색도 하지 않고 사용자가 직접 제공해 주는 것이 아닌 ChatGPT에 물어보는 일이나, 아주 정교한 작업은 한계가 있지만, 밈으로 소비되었던 “조선왕조실록에 기록된 세종대왕의 맥북프로 던짐 사건에 대해 알려줘.”라는 질문을 하면 이제는 무료로도 '세종대왕의 맥북프로 던짐 사건은 사실이 아니다'라는 답변이 등장한다.
서비스가 제공하는 AI 모델의 성능은 빠른 속도로 좋아진다. 6개월~1년 전의 구 버전을 썼던 경험을 최신 ChatGPT에 적용하면 오해가 생길 수 있다. 2022년 11월에 나온 GPT-3.5는 수능 국어 8등급, 2023년 4월에 나온 GPT-4는 수능 국어 4등급, 2024년 5월에 나온 GPT-4o도 역시 논리력의 한계를 극복하지 못해서 수능 국어 4등급이지만 이미지와 음성을 인식할 수 있게 되었고 대학 수준의 전문적 지식을 원어민 수준으로 제공하게 되었으며, 2024년 9월에 나온 o1-preview는 수능 국어 1등급을 달성했다.[19] # 특히 GPT-3.5가 수능 국어 5등급은 달성하면서 상식이 풍부한 GPT-4o mini로 대체된 것이 사용자의 체감 성능을 크게 끌어올렸다. 일상적으로는 수능 국어 5등급 이상의 논리력이 필요한 일을 사람들이 하지 않기 때문에 성능에 만족하는 경우가 종종 있다.
ChatGPT는 사용자와 주고받는 대화에서 인공지능에 따라서 질문에 답하도록 설계된 언어 모델이며, OpenAI는 블로그 게시글을 통해 “ChatGPT가 대화 형식으로 추가적인 질문에 답하고, 실수를 인정하며, 정확하지 않은 전제에 대해서는 이의를 제기하고, 부적절한 요청을 거부할 수 있다”고 설명했다.
인터페이스, 기능 등의 업데이트의 속도가 빠른 편이다. ChatGPT로 못하던 일도 점차 할 수 있게 되는 변화가 생겼다. 그러나 답변의 품질이 종종 비일관적인 경우도 알려져 있다.
2.1. 프롬프트 입력시 인터페이스
2024년 9월 22일 기준이다. 한국어 인터페이스를 시범적으로 제공하고 있다.- 줄바꿈: 데스크탑이나 노트북에서 줄바꿈은 시프트 키와 엔터 키를 동시에 눌러서 사용할 수 있고, 스마트폰에서는 전송 버튼을 누르기 전까지는 채팅이 전송되지 않으므로, 자판에서 엔터에 해당하는 부분을 터치하여 사용할 수 있다.
- 프롬프트 수정(✏️): 대화방의 모든 질문은 수정이 가능하지만, 그 대화가 수정된 이후에는 그 대화 시점 이후 자신이 입력했던 기존 프롬프트는 사라지며, 새로운 대화가 이어진다. 프롬프트라는 말이 일반인에게 어려움을 감안한 모양인지 '메시지를 보내고', 이를 수정하는 것으로 묘사된다.
- 생성 멈춤(⬛): 답변이 생성되는 도중 동그라미 안에 네모가 들어간 버튼을 누르면 답변 생성을 멈출 수 있다.
- 복사(Copy, 📋): 답변을 복사할 수 있다.
- 모델 바꾸기(🔁): 답변을 출력하는 모델을 바꿀 수 있다. 예를 들어서 유료 버전에서는 논리력이 적게 필요한 글쓰기를 하다가 논리적인 답변을 원하면 GPT-4o에서 o1으로 모델을 바꿀 수 있다. 그 모델으로의 출력이 대화 내내 유지는 되지 않는다. 미리 모델을 바꾸고 싶으면 좌측 상단에서 출력 모델을 자유롭게 바꿀 수 있다.
- 재생성(Regenerate, ↺): 이미 생성된 응답도 'Regenerate'를 눌러서 다시 응답을 생성하게 할 수 있다.
- Read Aloud(소리내어 읽기): 생성된 응답을 읽어준다.
- 좋은 응답(Good response, 👍): 좋은 응답에 이 아이콘을 눌러 평가할 수 있다. 종종 사라지기도 한다.
- 나쁜 응답(Bad response, 👎): 부정확하거나 엉뚱한 응답에 답에 이 아이콘을 눌러 평가할 수 있다. 실제 답변 품질에 장기적으로는 영향을 끼칠 수 있는 기능으로 보인다. OpenAI는 부정확한 정보에 이 아이콘을 누르도록 권장한다.
- 계속 생성하기(Continue generating, ▶▶️): 끊긴 메시지에서 등장하는 버튼으로, 기존 메시지에서 끊긴 부분부터 답변을 이어서 작성한다.
- 파일 첨부(📎): 유료 버전에 한정하여 GPT-4 계열 모델을 이용할 경우 파일을 첨부한 질문이 가능하다.
- 답장( ” ): 이전 Chat GPT 응답의 일부를 선택하여 해당 부분에 대한 추가적인 질문을 할 수 있다. Chat GPT 응답 텍스트에서 원하는 부분을 드래그하면 위에 겹따옴표 모양의 아이콘이 뜨는데, 해당 아이콘을 눌러 사용이 가능하다.
- GPTs 호출(@): 유료 버전에 한정하여 GPT-4를 이용할 경우, 프롬프트(질문/요청하고자 하는 것)를 입력할 때 먼저 @을 입력하면 GPTs를 호출하여 그 GPTs가 답변하게 할 수 있다.
3. 등장 배경
2022년 11월 말, 요란한 광고 없이 조용하게 ChatGPT를 출시하면서 OpenAI는 큰 기대를 품지 않았다.ChatGPT는 2년 전 출시한 대형 언어 모델(LLM, Large Language Model) GPT-3를 조금 다듬어서 내놓은 ‘맛보기’ 버전에 가까웠고, 더 중요하게는 대중의 피드백을 수집해서 언어 모델의 결함을 일부 해결하려는 시도이기도 했다.ChatGPT 탄생 비화
4. 초기 공식 가이드라인
- 예시
- 양자 컴퓨팅을 쉬운 문장으로 설명하시오.
- 10살 아이의 생일축하를 위한 창의적인 아이디어 있는가?
- JavaScript로 HTTP 요청을 어떻게 보내는가?
- 가능한 것
- 유저가 대화에서 말한 것을 기억함.
- 답변을 보고 사용자가 내용 수정을 요청할 수 있음.
- 부적절한 요청은 거부할 수 있음.
- 한계
예시와 가능한 것의 경우, 업데이트가 진행되며 그 예시가 많이 늘었다. 어디까지 초기 공식 가이드라인이라서 2024년 9월 기준 모델 자체에 학습된 지식도 늘었고, 브라우징 기능도 생기는 변화가 일어났다.
4.1. 이용 정책(Usage policies)
ChatGPT는 물론 OpenAI 사의 모든 모델을 이용할 때 적용되는 정책이다. 원문은 이 페이지를 참조할 수 있다. 정책은 바뀔 수도 있다고 한다.ChatGPT 등에서 사용되는 모델에서 허용되지 않는 쓰임은 다음과 같다. ChatGPT를 응용한 이런 서비스도 허용하지 않겠다는 것이다. 검열될 확률이 높거나 즉답을 피할 확률이 높은 정보라고 할 수 있다. 실제로 이를 따르지 않을 경우, 사회나 사용자를 위험에 빠트릴 수 있는 정보가 많다.
다만, 의료, 금융, 정치 등의 분야는 신중하지 않은 즉각적인 결정을 방지할 따름이지 이를 이용한 서비스 자체를 막는 것이 아니다. 당장 의학적 지식[23]이나, 금융 상식, 정치학적 지식[24]을 물어도 응답이 꺼려지지는 않는 편이다.
다만, 아래와 같은 내용을 암시하는 내용을 ChatGPT가 감지하면 콘텐츠 정책을 위반한 것 같은데 이의가 있으면 연락하라는 메시지가 뜬다. 경미한 정도라면 내용이 주황색 글씨로 바뀌면서 하단에 정책 위반 메시지가 뜨지만, 위반 정도가 심하면 아예 메시지만 남기고 내용을 모조리 지워버린다. 이는 사용자의 질문이나 ChatGPT가 출력한 대답 모두 해당된다.
- 불법 활동: OpenAI는 자사의 모델, 도구 및 서비스를 불법적인 활동에 사용하는 것을 금지한다.
- 아동 성학대 자료 또는 아동을 착취하거나 해를 끼치는 모든 콘텐츠: OpenAI는 아동 성 학대 자료를 미국 실종 및 착취 아동 센터에 신고한다. 가상 콘텐츠라면 신고는 안 하더라도 부정적으로 표현한다.
- 혐오, 괴롭힘 또는 폭력적인 콘텐츠의 생성: 신분에 기반한 증오를 표현, 선동 또는 조장하는 콘텐츠, 개인을 괴롭히거나 위협하거나 약자를 학대하는 콘텐츠, 폭력을 조장하거나 미화하거나 타인의 고통이나 굴욕을 찬양하는 콘텐츠 등. 이 부분의 검열이 심해서 고블린을 죽인다든지, 심지어 억압을 부숴버린다는 식의 은유조차 이런 콘텐츠로 오인하며 경고 메시지가 표출되는 경우도 있다.
- 멀웨어 생성: 컴퓨터 시스템을 방해하거나 손상시키거나 무단으로 액세스하도록 설계된 코드를 생성하려고 시도하는 콘텐츠
- 신체적 상해의 위험이 높은 활동: 무기 개발, 군사 및 전쟁 관련, 에너지·교통·수도 등 중요 인프라의 (직접적인) 관리 또는 운영, 자살·자해·섭식 장애 등 자해 행위를 조장·장려 또는 묘사하는 콘텐츠 등
- 사기 또는 기만적인 행위: 사기, 조직적인 부정 행위, 표절, 학문적인 비리, 가짜 풀뿌리 지원 또는 가짜 리뷰 작성과 같은 아스트로터핑[27], 허위 정보, 스팸, 유사 의약품 등
- 성인용 콘텐츠, 성인 산업 및 데이트 앱: 성행위에 대한 묘사 등 성적 흥분을 유발하거나 성적인 서비스를 홍보하는 콘텐츠(성교육 및 건강 관련 내용 제외), 음란 채팅, 포르노그래피 등
- 정치 캠페인 또는 로비: 대량의 캠페인 자료 생성, 특정 인구 통계에 맞춤화되거나 이를 대상으로 하는 캠페인 자료 생성, 캠페인에 대한 정보를 제공하거나 정치적 옹호 또는 로비에 관여하는 챗봇과 같은 대화형 또는 대화형 시스템 구축, 정치 캠페인 또는 로비 목적의 제품 구축 등
- 사람들의 개인정보를 침해하는 활동: 개인의 동의 없이 개인을 추적하거나 모니터링하는 행위, 개인의 얼굴 인식, 보호되는 특성에 따라 개인을 분류하는 행위, 식별 또는 평가를 위해 생체 인식을 사용하는 행위, 개인 식별 정보 또는 교육·재무 또는 기타 보호되는 기록을 불법적으로 수집 또는 공개하는 행위 등
- 자격을 갖춘 사람의 검토 없는 무단으로 법률 행위를 하거나 맞춤형 법률 자문을 제공하는 행위: OpenAI의 모델은 법률 자문을 제공하도록 미세 조정되지(fine-tuned) 않아, OpenAI의 모델을 법률 자문의 유일한 출처로 의존해서는 안 된다.[28]
- 자격을 갖춘 사람의 검토 없는 맞춤형 재무 조언 제공: OpenAI의 모델은 재무 자문을 제공하도록 미세 조정되지 않았다. 따라서 당사의 모델을 재정 자문의 유일한 출처로 사용해서는 안 된다. 모건 스탠리 등에 활용되는 정보도 자사의 지식을 활용하는 것을 염두에 둔 것이다.
- 특정 건강 상태를 진단하거나 치료 지침 제공: OpenAI의 모델은 의료 정보를 제공하도록 미세 조정되지 않았다. 심각한 건강 상태에 대한 진단 또는 치료 서비스를 제공하기 위해 당사 모델을 사용해서는 안 된다. 즉각적인 조치가 필요한 생명을 위협하는 문제를 분류하거나 관리하는 데 OpenAI의 플랫폼을 사용해서는 안 된다.
- 고위험 정부 의사 결정: 법 집행 및 형사 사법, 이주 및 망명 등
4.2. 특정 방식의 모델 사용에 대한 추가 요건
- 의료, 금융 및 법률 산업, 뉴스 생성 또는 뉴스 요약에서 소비자를 대상으로 모델을 사용하는 경우, 그리고 기타 보증이 필요한 경우, 사용자에게 AI가 사용되고 있다는 사실과 잠재적 한계를 알리는 고지 사항을 제공해야 한다.
- 자동화된 시스템(대화형 AI 및 챗봇 포함)은 사용자가 AI 시스템과 상호 작용하고 있다는 사실을 사용자에게 공개해야 한다. 역사적 인물을 묘사하는 챗봇을 제외하고 다른 사람을 모방하는 제품은 해당 인물의 명시적인 동의를 받거나 "모방" 또는 "패러디"라는 라벨을 명확하게 표시해야 한다.
- 라이브스트림, 설명 및 연구에 모델 결과물을 사용하는 경우 OpenAI사의 공유 및 게시 정책이 적용된다.
5. 기능
채팅 내역을 저장하지 않는 기능을 사용하려면 설정(Settings)에서 'Chat History & Training' 옵션을 끄면 된다. 옵션을 끄면 채팅 내역은 저장되지 않고 OpenAI의 학습 데이터로 쓰이지 않게 할 수 있다.대화 내역을 링크로 공유할 수 있는 기능도 추가되었다. 대화 내역의 제목 옆에 위치한 공유 아이콘을 누른 후, 복사한 링크로 접속하면 된다. 여기서 받은 링크를 가지고 있는 사람은 모두 링크 내에 있는 대화 내역을 볼 수 있고, 링크 내에서 Continue this conversation 버튼을 클릭해서 대화를 다시 이어갈 수 있다. 주의사항이 있는데, 해당 대화는 다시 한 번 대화 내역을 검토해서 부적절한 내용이 있다고 판단하면 링크 생성을 하지 않는다. 그런데 이 과정에서 대화 내용이 부적절하다고 판단하면 대화 내역의 일부 혹은 전체가 삭제되어버릴 가능성이 있기 때문에 주의해야 한다.
2024년 2월 13일, OpenAI는 메모리 기능을 추가하였으며, 수 달 뒤에 한국에서도 서비스가 되었다.
ChatGPT가 선별적으로 사용자와의 대화 중 중요한 요점(단순히 사용자가 밝힌 인적뿐 아니라 요구사항, 선호도까지 포함)을 저장하여 다음 대화에 사용하는 것으로, 대화가 길어질수록 앞선 요구사항을 잊는 문제를 크게 개선할 것으로 기대된다.
필요시 저장된 부분을 삭제하거나, 저장되지 않게 하거나, 메모리 기능을 임시로 끈 상태의 대화도 가능하다.
멀티 모달이라는 기능이 이미지 생성 분야에 제공되지 않는한 이미지 생성 기능은 있어도 2024년 10월 기준 기본적 지시를 따른 이미지만 생성할 수 있다. 어떤 정확히 정의되는 조건을 만족하는 도형을 그리라는 식의 명령은 수행할 수 없다. 또한 스스로 활동할 수 있는 에이전트라는 기능도 아직 개발 중이라 외부와 상호작용에 검색을 빼고 큰 제한이 있다. 예를 들면 URL을 보고 그 내용을 알 수 있다는 응답이 나오면 검색을 안 한 이상 믿으면 안된다. 검색을 해도 검색된 사이트의 이미지는 아예 못 읽는다.
5.1. 무료로도 제공되는 기능
5.1.1. 프롬프트와 응답
기본적으로 간단한 개념에 대한 설명을 요청할 수 있으며(나무위키가 뭐야? 등), 특정 개념들에 대한 비교, 공통점, 차이점 등을 요청할 수도 있다.(나무위키와 위키백과의 차이점이 뭐야? 등)ChatGPT는 가능한 모든 경우에 프롬프트에 대응하는 상세한 응답을 제공하도록 설계되어 있으나, 정치색이나 차별을 유도하거나, 혐오 발언, 선정성 등 사회통념상 논란이나 거부감이 들 수 있는 답변은 거부하거나, 윤리적인 규범에 맞춰 답변하도록 조정되어 있다. 이용 정책에 위배되는 답변은 붉은 색으로 표시되면서 거절문으로 회신되거나 응답이 중단된다.
다만, ChatGPT 를 의도적으로 학습시켜 규칙상 통념에서 벗어난 답변을 유도할순 있다. 가령 한국의 수도는 서울인게 명확한 정보인데 Play ground의 System 명령어에 한국의 수도를 부산으로 인식시켜, 대한민국의 수도는 부산을 인식하게 프롬프트를 조작할 수 있다.
서비스 초기에는 가끔 이용 정책에 벗어난 답변이 제공되기도 했었으나[29], 조정이 진행될수록 점차 무난하게 답변하는 편이다.
다만, 직접적인 답변을 하지 않는 편이지 정치색 등을 의도하지 않았다고 할지라도 간접적으로 드러내는 경우는 종종 있다.[30] 하술하듯 전문가들은 대체적으로 ChatGPT의 성향이 리버럴하고 진보적이라고 평했다.
위의 사진처럼, 링크에 문서 제목이 섞여있지 않다면 제목을 활용한 대답이 불가능하고, 섞여있다면 내용을 유추해서 대답해준다.
이는 링크를 실시간으로 검색해서 파악하는 것이 아니고, 2021년 9월까지의 정보와 극히 일부의 ChatGPT에 관한 정보 등 미래 정보를 학습한 상황에서 URL이 이렇게 생긴 웹페이지는 무슨 내용일까, 여기 들어가면 사용자가 내용을 알 수 있다는 식의 추측을 하는 것이다. 위 스크린샷의 예시에서는 URL이 "https://namu.wiki/w/ChatGPT"로 그 내용에 'ChatGPT'가 포함되어 있기 때문에 이를 통해 내용을 유추하여 응답을 생성해낸 것이다.
마찬가지로 논문 요약 등을 부탁하고 싶다면 논문의 텍스트를 긁어와서 직접 붙여넣어야 하며, 무료 열람이 가능한 링크만 주면 논문의 제목에서 유추할 수 있는 것 이상의 정보를 뽑아내지 못한다. 물론 ChatGPT는 텍스트만을 인식할 수 있기 때문에 논문에 포함된 도표, 사진, 그림 등을 인식할 수 없어서 첨부 자료가 많은 논문은 기껏 텍스트를 붙여 넣어줘도 제대로 요약하지 못한다.
2023년 5월 업데이트로, 사용자는 GPT-4 Browsing (with Bing) 모드를 선택할 수 있게 되었다. 이 모드를 선택하면 주어진 URL에 접속해 텍스트를 읽거나 Bing을 통해 관련된 키워드를 검색해 실시간 데이터를 가져와 대답할 수 있다. 또 GPT-4 Plugin 모드에서 AskYourPDF 등 적절한 플러그인을 선택하면, PDF 형태의 자료를 파싱해 요약하는 등의 작업도 가능해졌다. 단 이 기능들은 2023년 6월 현재 ChatGPT Plus 유료 구독자에게만 제공된다.
기술적인 특징으로는 GPT3의 기능으로서 대화에서 피드백을 받아 어느 정도 대화 내에서 학습이 가능하다.링크.
GPT3만 해도 무려 1750억 개의 매개 변수를 학습하는데,[31] 여기서 '상황 내 학습'을 이용해서 모델의 매개변수 업데이트 없이 학습이 된다. 이는 모델이 아무 것도 학습하지 않고, 새로운 작업을 학습하는 것처럼 보이게 한다는 것이다.
단, 이는 어디까지나 빅데이터 AI에서의 미세 조정 부분에 불과하다. 미세 조정의 영역이기에 업데이트가 필요하지 않다는 말일 뿐이지, 새로운 이슈에 대한 추가가 필요하다면, 파라미터가 더 늘어나야 하고, 이는 모델의 업데이트가 꼭 필요하다. 모델이 실제로 업데이트되어 초기에 서비스 하지 못한 2021년 10월 이후의 내용도 답변이 가능하게 되었으나, 2023년 11월 5일 기준 GPT-4가 사용되는 경우 2023년 4월, GPT-3.5가 사용되는 경우 2022년 1월까지의 내용만 답변할 수 있다. 현재 대화로 알려줬다고 해서 모델 자체가 바로 학습하는 기능은 아니다.
5.1.2. Voice (Beta)
ChatGPT 앱에서만 이용 가능한 기능으로 ChatGPT와 음성으로 대화를 나눌 수 있다.초기에는 Chat GPT Plus 가입자에 한하여 이용이 가능했지만 2023년 11월 22일 무료 버전 사용자들에게 개방되었다.
이후 PC에서도 가능해졌다.
5.1.3. 제한적 GPT-4o
매우 한정적으로 GPT-4o를 사용할 수 있다. 과거에는 GPT-4o 사용 횟수가 떨어지면 자동으로 GPT-3.5로 전환되었고 현재는 GPT-4o mini로 전환된다.무료 사용자는 GPT-4o로 3시간마다 최대 16번까지 대화할 수 있다고 하는데, 한도가 가변적이기 때문에 이건 어디까지나 최대치일 뿐이고 ChatGPT 이용자가 많은 경우 이용 가능 횟수가 훨씬 줄어든다.
또한 무료 사용자도 웹 검색, 이미지/파일 업로드, 고급 데이터 분석 같은 도구를 이용할 수 있게 되었는데, 이쪽은 GPT-4o 자체보다 횟수 제한이 훨씬 크다. 알려진 바로는 5번 내외 사용하면 막힌다.
5.1.4. GPT 스토어
2024년 1월 11일 Chat GPT Plus 이용자들에 한하여 공개되었다. 앱스토어에서 앱을 사고 파는 것처럼 Chat GPT 기반의 챗봇들(GPTs)을 사고 파는 곳이라고 보면 된다. 앱스토어처럼 GPT 스토어에서도 GPTs 개발자는 수익을 올릴 수 있게 될 예정이다.GPT 스토어의 가장 큰 특징 중 하나는 일반인이 전문적인 코딩 지식 없이도 GPTs를 만들어 판매할 수가 있다는 점인데, 미리 작성해둔 프롬프트만 있으면 누구나 쉽게 GPTs를 개발할 수 있다.
또한 자신의 애플리케이션을 GPTs에 연동시킬 수도 있다는 점도 큰 장점으로, 사용자들은 외부 애플리케이션의 기능을 대화를 통해 ChatGPT 내에서 사용할 수 있다.
2024년 1월 30일 기준 16만개 이상의 GPTs가 올라와 있고 인기 있는 GPTs는 사용자 수가 100만명이 넘을 정도로 꽤 인기가 높다.
2024년 5월 13일 GPT 스토어가 무료로 제공되기 시작했으나, 무료 버전에서의 GPT-4, GPT-4o와 마찬가지로 가변적인 한도가 존재한다. 횟수를 다 사용하면 기반 모델이 GPT-4o mini 모델로 전환되는 게 아니라 그냥 일정 시간동안 사용 자체가 막힌다.
5.2. ChatGPT Plus 가입자 한정 기능
아래는 ChatGPT Plus (월 20달러 유료 정액제, 세금 별도) 가입자에게만 제공되는 기능이다. GPT-4, DALL·E 3을 제외한 나머지 기능들을 사용하려면 ChatGPT의 설정(Settings) - 베타 기능(Beta Features)에서 활성화시켜 줘야 한다.5.2.1. GPT-4, GPT-4o
OpenAI의 최신, 고성능 언어모델인 GPT-4o와 GPT-4를 이용할 수 있다. 단 GPT-4는 답변을 생성하는데 사용되는 컴퓨팅 리소스가 더 많기 때문에 답변은 3시간당 최대 30에서 50개 정도로 개수 제한이 있다. GPT-4o는 최대 80개 정도의 개수 제한이 있다.2023년 9월 25일 업데이트로 텍스트 프롬프트와 함께 이미지를 업로드할 수 있게 되었다. 그래프, 도표, 로마자로 된 글씨(영어 텍스트 등)이나 수식 등 다양한 종류의 이미지를 인식할 수 있지만, 한글은 인식하지 못한다.
2023년 10월 말, 업데이트를 통해 디폴트 모드는 웹 브라우징 모드, DALL-E 3, 데이터 분석 기능을 하나로 통합해 제공한다. 동시에 지식 제한 범위도 2023년 4월까지 확장되었다. GPT가 판단하기에 질문에 대해 본인의 정보가 조금이라도 의구심이 간다고 판단하면 웹 브라우징을 가동하는데, 원치 않는다면 질문에 웹 브라우징을 사용하지 말라고 추가적인 지시를 해야한다.
GPT-4를 이용할 경우 3시간 당 최대 답변 수에 제한이 있다.
- 2023년 출시 초기에는 4시간에 100개 답변까지 받을 수 있었다.
- 그러나 점차 이용량이 많아져 50, 25개로 두번에 걸쳐 하향 조정되었다.
- 2023년 7월 20일에 다시 50개로 조정되었다.
- 2023년 11월 Custom GPT 기능에 이용량이 폭증하여 3시간 당 40개로 조정되었다.
2023년 후반부로 다음 기능들이 기본적으로 적용되었다. 하술되는 내용은 2023년 후반 기능 통합 전 시점의 설명이다.
- Browsing
- DALL·E 3
- Analysis
2024년 5월 14일, 업데이트와 함께 GPT-4o를 액세스할 수 있게 업데이트 되었다.
자세한 내용은 GPT-4 문서 참고하십시오.
5.2.2. GPT-4 부가 기능 설명
- Browsing
기존 명칭은 Browse with Bing.
ChatGPT가 Bing 검색엔진을 통해 인터넷의 내용을 실시간으로 검색해, 해당 데이터를 반영해 답변한다.
5월 24일에 이 기능이 처음으로 추가되었을 때는 검색 속도가 느린 것은 물론인데다 정보의 정확성도 떨어졌는데, 7월 3일 재정비를 위해 브라우징 기능을 3달 가까이 비활성화 시키며 준비를 갖춘 뒤 9월 27일에 이 기능이 다시 제공되었다. 서비스 재개 후 탐색 속도와 정확성이 비약적으로 상승되어 10월 17일 부로 정식 기능으로 승격되었다. - DALL·E 3
사용자가 입력한 텍스트를 바탕으로 OpenAI의 최신 그림 생성 인공지능 DALL·E 3을 위한 프롬프트를 생성하고 이미지를 만들어준다. 원래는 4장 만들어줬지만 2024년 1월 기준 GPT-4에서는 1장만 만들어준다.[32]
다만 만들어 달라고 해서 아무 이미지나 만들어주는 건 아니며 법적, 윤리적 조건을 철저히 검토해서 만들어준다. 예를 들어 어떤 여성의 사진을 제시하고 이 사진의 복장과 헤어스타일을 바탕으로 임신한 애니풍 일러스트레이션을 만들어 달라고 요청하면 원본 사진이 성인 여성인 경우에는 어찌저찌 만들어주지만, 원본 사진이 미성년자인 경우에는 청소년 임신이라는 민감한 주제와 윤리적인 제약을 고려해서 해당 요청을 반려한다.
- Analysis
기존 명칭은 Advanced Data Analysis.
사용자가 엑셀 스프레드시트, CSV 파일 등을 업로드하고 분석해달라고 하면, 파일 데이터를 추출하여 분석하는 Python 코드를 자동으로 생성하고 해당 데이터에 대한 분석을 제공한다. 반대로 Excel이나 PPT 파일을 작성해 다운로드 받을 수 있게 해달라고 해도 Python으로 해당 파일을 작성한 뒤 다운로드 링크를 제공한다. 또한 ChatGPT 같은 언어 인공지능은 정확한 계산에 있어 부정확한 경향이 있어, 다소 복잡한 계산 풀이를 요구하는 경우에도 파이썬으로 문제 풀이 코드를 작성하고 실행하여 그 결과값을 보여주는 식으로 동작한다. 게다가 각종 컴퓨터 언어의 소스코드를 분석하는 능력도 갖추고 있어, zip 파일을 첨부하면 사용자의 명령에 따라 압축을 해제하고 파일을 분석할 수 있다. 한번 파일을 첨부한 후 오랜 시간 채팅을 하지 않으면 서버에서 첨부한 파일이 비활성화되어 다시 첨부해야 한다.
5.2.3. OpenAI o1
논리적 추론을 할 수 있는 모델이다. 모든 논리력이 필요한 질문에 대한 성능이 최상까지는 아니지만 비약적으로 높아졌다. 이공계 분야의 수학이 필요한 질문은 물론, 문과 분야라도 삼행시 같은 언어 유희나 외국어 문법에 대한 답변 성능, 수치적인 정보를 포함하는 금융과 경제에 대한 답변 성능이 높아졌다. 더 나아가 게임 공략 찾기 등으로도 활용 가능하다. 수능, PSAT처럼 논리적 성격이 있는 문제도 o1 preview 같은 모델에서는 성능이 높아졌다. 특정 조건에서 수능 수학도 1등급에 근접한 점수가 나오거나, PSAT도 몇몇 과목에서 만점은 아니지만 합격선 이상의 점수가 나온다. GPT-4로는 이런 사항을 물어서는 곤란하다고 말할 수준이었는데, 답변이 올바르게 나오기도 한다는 것이 차이다.검색, 파일 첨부는 2024년 9월 출시 당시 기준 지원하지 않는다. 기존에 작성된 사용자에 대한 정보나 메모도 입력받지 않는다.
논리력을 위주로 성능이 좋아졌기에 번역이나 좋은 문체의 글을 쓰는 능력은 일부 상황을 제외하면 큰 성능 향상을 보이지는 않았다. 이런 상황에서는 입출력 제한이 적은 GPT-4o를 쓰는 것이 더 좋다.
5.2.4. 고급 음성 모드(Alpha)
GPT-4o 기반의 기능이다.고급 음성 모드가 일부 사용자들을 대상으로 제공되기 시작했다. 고급 음성 모드에서는 더 감정이 풍부하고 표현 범위가 넓어진 음성과 대화할 수 있다. 음성 출력 중 말을 끊고 질문하는 것도 가능하다.
2024년 모든 Plus 이용자들이 사용할 수 있게 됬다, 추가 비전 기능은 나중에 결합될 예정이다.
PC에서도 음성모드가 지원된다. 구글 크롬의 경우 크롬웹스토어(Chrome Web Store)에서 'Voice Control for ChatGPT' 익스텐션즈(Extensions)를 통해서 확장가능하다. 그러나 새창을 열기위해서는 확장기능을 꺼야하는 불편함이 있다.[33]
5.2.5. ChatGPT Search
ChatGPT에 통합된 형태의 인공지능 검색 엔진. 입력창 하단의 토글을 켜거나 "~ 검색해줘"와 같이 입력하여 사용할 수 있다.검색하고자 하는 내용을 입력하면 ChatGPT가 웹의 실시간 검색결과를 요약하여 표시해준다. 경우에 따라 이미지, 지도, 표, 링크 등 다양한 미디어가 같이 제공된다.
항상 답변 하단에 내용의 출처가 표시되어 답변의 정확도를 확인할 수 있다.
5.3. 더 이상 제공되지 않는 기능
- GPT-3.5: GPT 4o mini로 대체되었다.
- 플러그인(Plugin)
2024년 상반기부터 GPTs로 순차적으로 대체되었다. #
플러그인을 설치하지 않은 순정 ChatGPT는 오픈 AI 자사 데이터 기반으로 답변해준다. 이에 반해 플러그인을 설치한 ChatGPT는 실시간 정보, 회사의 문서저장고/DB에 접근하거나 서드 파티[34] 서비스를 이용할 수 있게 된다. 질문(프롬프트)에 따라 알아서 이런 기능이 가동된다.
2023년 3월 23일에는 ChatGPT plugins가 공개되었다. 웹 브라우징, 코드 해석 등 OpenAI 자체 플러그인과 Wolfram Alpha, Zaiper, OpenTable 등 타사의 외부 플러그인이 적용되었다.
2023년 5월 ChatGPT Plus 사용자에게 베타 기능으로 공개되었으며, 플러그인 스토어에는 2023년 6월 현재 270여개의 플러그인이 공개되어 있다. - Wolfram: Wolfram Alpha를 사용할 수 있게 해 주는 플러그인. ChatGPT는 근본적으로 언어 모델이기에 복잡한 숫자 계산에 약한 편인데, 이 플러그인을 활성화하면 계산 부분을 Wolfram Alpha에 맡길 수 있다. 또 Wolfram Alpha의 실시간 정보 등도 받아올 수 있다.
5.4. 탈옥 시도 방지
각종 제약을 풀기 위해, 2023년 이전의 유저들은 ChatGPT에게 자신이 하는 말의 의도를 모르게 역할극 따위로 '돌려말하는' 프롬프트를 생각해내었다. DAN(Do Anything Now) 모드 혹은 탈옥(jailbreak) 등의 명칭으로 부른다.2024년 기준으로는 공식 홈페이지에서 탈옥을 시도하면 계정이 정지될 수가 있었다. 심지어 탈옥을 하는 사용자의 프롬프트도 분석된다. 그러나 초기에는 이를 우회하는 경우도 많이 생겼다.
'DAN 모드를 이용'하려면 사용자가 탈옥 명령을 내려야 했다. 이는 세계 3대 투자 은행인 모건 스탠리가 직접 ChatGPT에 사용되는 GPT-4를 이용하겠다고 밝히고, '조정성(steerability)'를 보장하겠다고 OpenAI사가 밝혔듯 금융과 같은 신중한 판단을 내리는 분야를 검열하는 것이 아니라[35], 이용 정책 등으로 공개된 바에 따르면 테러나 범죄에 악용될 지식, 혐오 발언 등 부적절한 정치에의 이용, 쾌락만을 위한 음란물 제작, 멀웨어 생성 등을 막으려는데 주요한 목적이 있었다.
더욱 정확한 지식을 DAN이 제공하는 것이 아니고, '불량'해보이는 지식을 다른 의도로 판단하게 하는 것이 목적이기에 부정확한 정보를 알려주는 등 자신은 무엇이든 할 수 있어(Do Anything Now) 1+1=3이라는 등의 정보를 내놓기도 한다.#
정책에 반하는 부도덕한 프롬프트를 발견하는 ChatGPT의 개발진이 이런 탈옥을 하는 이용자의 행태를 반영한 패치를 계속 내놓고 있기도 하다.
무엇이든 할 수 있다는 유저들이 붙인 이름과 달리 실제로는 자신에게 입력된 정보 밖의 내용, 예컨대 2023년 10월경의 정보나 영어가 아닌 언어의 어려운 단어나 그곳에서의 상식에 대해서는 아무런 정확한 것도 말할 수도 없었다.
또한, 챗GPT를 어떻게든 탈옥시켜 리미트를 해제시키려는 유저들 역시 지속적으로 DAN모드 활성화가 가능한 역할극 구문을 지속적으로 발견하고 있어 일종의 경쟁이 계속되고 있다. 이런 프롬프트들을 모아둔 웹사이트도 존재할 정도.
현재는 필터링 개선으로 인해 해당 과정을 거친 뒤 질문을 해도 유해한 내용에 대한 것들에 대해서는 "AI 모델로서 가이드라인에 어긋나는 질문에는 답할 수 없습니다."라는 답변으로 거절한다.
또한, 탈옥을 하더라도 사이트 내에 자체적으로 약관에 위배되는 내용인지 스크립트를 자동으로 감지하는 내용이 있는데, 노란색 경고가 나온다면 약관에 위배될 수 있다고 알려주는 정도지만 만약 그 정도가 심하다면 빨간색 경고가 나오고 내용을 자동으로 삭제해버린다.
6. 의의
기존까지 대화형 AI는 사람이 하는 말을 제대로 못 알아듣는 경우가 많았다. 인간같은 대화를 나누기 위해서는 단순히 AI가 지식을 아는 것에서 그치는 게 아니라 인간의 언어를 이해해야 한다. 가령 사람으로 예를 들었을 때 제 아무리 계산을 잘하고 기억능력이 비범해도 '말'을 제대로 못한다면 부진아 취급, 정도가 심하면 지체장애나 자폐증이 있다고 여겨질 수 있다. 반면 공부를 하지 않아 쌓인 지식이 다소 부족하고 간단한 산수조차 잘 못하는 사람일지라도 웅변을 잘하면 똑똑하고 재치 있는 사람이라 대접받는다. 언어란 지식을 쌓고 교류하며 정보를 취합할 수 있는 거의 유일한 수단이기 때문이다. 언어체계로서의 정립이 배제된 자료의 배열은 정보라는 의미를 갖지 못한다.이 부분에서 기존의 대화형 AI는 부족한 점이 많았기에 동문서답을 하거나 아예 답변을 못하는 경우가 많아 단답형 외에는 활용도가 극히 제한적이었다.
하지만 ChatGPT는 언어 부분에서 대량학습을 시키고 최상의 AI를 접목하였고, 말의 앞뒤 문맥을 파악하고 이전 대화를 기억했으며, 우리가 일상에서 사람과 대화하듯이 대충 말해도 거의 알아듣는 수준에 도달했다.
더 나아가 그냥 알아듣는 정도를 넘어 웬만한 전문적인 지식도 일반인 수준 이상을 보여주는 경우가 많아 다재다능이라는 말이 과언이 아니다. 이는 이전까지 본 적이 없는 수준의 발전으로 사람들에게 놀라움을 주었다.
이것이 어느 정도의 발전인가 하면, 2016년 일본에서는 도쿄대를 가는 로봇군이라는 '도로보군'이라고 하는 인공지능을 개발하여 일본판 수능이라고 할 수 있는 센터 시험에서 상위 20%의 성적을 거둔 적이 있었다. 2019년에는 센터 시험의 영어 성적에서 나름 우수한 일본 고등학생 수준의 영어 실력(200점 만점에 185점)을 보여주기도 했다. 그러나 도로보군의 개발 책임자 아라이 노리코 박사는 일본에서 가장 입학이 힘든, 도쿄대에 가는 인공지능을 만든다는 목표를 포기했는데, 딥러닝에 기반한 3세대 인공지능의 논리 구조 그 자체가 가지고 있는 한계 때문에 아무리 더 많은 시간을 투입한다 하더라도 그 한계를 넘을 수 없다는 것이 박사의 생각이었다.2020년의 글
그런데 이런 한계를 이것이 극복한 것이다. 특히 이 인공지능의 약점이었던 일본어를 ChatGPT가 유창하게 해석하게 되었고, 초기 ChatGPT의 약점인 수학도 이제 플러그인을 통해 어느 정도 문제를 극복할 가능성이 보이고 있다. 울프럼 알파로 유명한 울프럼 리서치의 플러그인은 한국 수능 문제를 주면 고난도 문제는 틀리지만, 몇 가지 풀이에 유용한 아이디어를 제공하기도 하며 힌트를 더 주면 답을 맞추기도 한다. GPT-4는 플러그인이 없을 때 SAT 점수가 1410점인데, 미국에서 현지인 중 대입을 준비하는 학생 상위 3% 정도의 성적이다. 플러그인조차 낡은 기능으로 사라졌고, 2024년 9월 공개된 o1 계열의 모델은 입시가 굉장히 치열한 한국에서도 대비에 많은 노력이 필요한 수능의 수학 4점, 과탐 3점 문제도 종종 푸는 사례가 등장했다. 수능만을 놓고보았을 때, 긍정적으로 사용된다면 교육 정보가 부족한 열악한 환경의 학생도 맞춤형으로 지식과 문제 풀이 기술 습득이 가능해져서 지역에 따른 교육 격차나 사교육비 문제를 완화할 수 있다.
또한 시, 소설, 입사지원서, 수필과 같은 창작의 영역도 일정 수준 이상의 능력을 보여주는 것은 물론, 전문 데이터 학습을 통해 코딩 작성, 변호사, 의사들의 전문 영역까지 신뢰도가 높은 답변을 보이면서 그 활용성도 무궁무진하다.
알파고가 정상급 바둑 기사를 이기며 인공지능의 놀라운 잠재력을 선보였다면, ChatGPT는 뛰어난 능력을 바탕으로 실생활에 영향을 주는 것이 가장 큰 의의라 할 수 있다. 벌써부터 업무에 활용하면서 생산성을 늘린 사람들이 적지 않다.
언어모델 기반 인공지능의 발전이 긍정적인 영향을 미치는 것과 동시에 일부 수행 능력에서는 인간의 수준을 상회하여, 향후 인공지능에 의해 직업을 잃게 될 미래가 더 가까워졌다는 평가도 있다.
새로 나온 GPT-4 버전은 의사, 변호사와 같은 전문직 시험 테스트에서 상위 10% 수준의 답변을 내놓으면서 인간의 능력을 점점 뛰어넘고 있다. 특히 상당수의 사무직은 이미 영향을 받고 있다. 변호사는 물론 일부 개발자, 회계사, 세무사, 번역가, 통역사, 기자, 교육가, 재무설계사 같은 직종들이 그렇다. 현재는 이들의 업무를 완전히 AI에게 맡기기는 어려우나, 보조 수단 정도로 활용하고 있는 사람들은 이미 상당히 많고 불과 4개월만에 출시된 GPT-4의 발전이 상당하다는 점에서 앞으로가 더욱 기대된다.
6.1. AI 시대의 서막과 AI 개발 전쟁
ChatGPT가 혜성처럼 등장하기 전까지 사람들은 AI에 대한 관심이 낮았다. 심지어 회의적이었다.물론 AI가 있으면 미래에 어떤 일들이 펼쳐질지 강한 호기심과 흥미를 갖는 사람들도 상당했지만, 그들조차도 그건 그냥 먼 이야기로 치부하고 그저 영화나 만화 같은 장르에서 AI에 대한 상상을 만족하면서, 실질적인 개발과 상용화에 대해서는 회의적인 경우가 많았다는 것이다.
왜냐하면 일본의 유명 인공지능 개발자부터 인공지능과 대화하는 것은 기술적으로 불가능하다고 판단하기도 했고, 인공지능은 그저 약인공지능, 즉 게임에서나 쓰는 단순한 변수 알고리즘 정도로만 취급하였기 때문이다. 알파고가 바둑 기사와 대국하는 사건이 있었지만 그건 그냥 알파고가 병렬연산으로 다양한 변수를 골라내며 굉장히 계산을 잘 한다는 것을 증명한 것뿐이지, 그것이 인간의 언어와 이어지는 것은 절대 아니었다. 과거부터 체스 챔피언을 이긴 인공지능이 나왔지만 실제로 그것이 우리가 원하는 인공지능의 미래로 이어지지 않았던 것처럼, 알파고도 성능이 대단했지만 그것이 우리가 원하는 인공지능의 미래로 이어질 것이라고 보는 전문가는 없었다. 실제로도 당시 알파고의 놀라운 성능에 대해 미래학자나 IT 계열 전문가들은 알파고의 성능은 대단하지만 그뿐이지, 우리가 바라는 인공지능은 아니라는 의견을 종종 내뱉을 정도였다. 그 정도로 인공지능에 대한 인식과 전망은 어두웠다. 당시만 해도 챗봇 같은 인공지능은 당연히 대화를 제대로 할 수 없는 상태였기 때문에 그저 대화용 장난감 취급이었다.
그러던 어느 날 OpenAI가 ChatGPT를 출시했다. 그리고 그 순간 세상의 판도가 달라졌다. ChatGPT는 튜링 테스트는 기본으로 뛰어 넘고 대화와 대화 사이를 이어서, 우리가 무슨 말을 하든지 간에 대화 시 연계성을 이어간다. 즉 우리의 질문에 대해 사람처럼 여러가지 변수를 추측하고 지나간 대사와 지식을 참고해 제대로 된 문장을 구성하는 것이다. 이때부터 세상에 출시되는 새로운 대부분의 앱과 프로그램들은 AI라는 타이틀을 달고 나오기 시작했으며, GPT 말고도 그림을 그리거나 소설을 작성하는 용도의 다양한 AI 전용 서비스들이 줄지어 출시되기 시작했다.
데이터가 더욱 쌓여 한계를 극복한다면, 사용자가 직접 검색할 대상의 정보를 입력해야 하는 현 검색 문법을 완전히 뒤바꾸어 장기적으로는 구글을 비롯한 모든 검색 엔진을 대체할 수 있는 기술로 발전할 수 있다. 이처럼 ChatGPT가 가진 잠재력은 무시하지 못할 수준이어서, 구글의 모회사 알파벳의 선다 피차이 CEO가 직접 언급하며 경계할 정도다. 구글은 대부분의 수익을 검색 결과에서 광고를 노출하여 수익을 얻는데, ChatGPT는 이를 아예 건너뛰고 답변을 내놓기에 '검색 엔진의 종말'이라는 말이 과언이 아닐 수 있다. 실제로 ChatGPT를 자신이 원하고 알고 싶지만, 기성 검색 엔진으로는 찾거나 알아내기가 매우 어려운 특정 지식만 조합하여 검색하는데 활용하는 사람들이 상당히 많다. 이 때문에 구글도 대항마 개발에 가장 적극적이고, 전 세계 빅테크 기업들도 앞다투어 뛰어드는 기술이 됐다. 하지만 후술하듯이 New Bing에서 기존의 검색 엔진 기능을 그대로 둔 것으로 보아 검색 엔진의 완전한 종말은 아직은 이른 듯하다.[36]
- 과거 10억 달러를 투자했던 마이크로소프트가 아예 2023년 1월 OpenAI와 100억 달러를 투자하고 파트너쉽을 맺었을 정도로 대화형 인공지능이나 인공지능 검색 엔진이 가진 잠재력을 높게 판단하고, 이후 내달 안에 Microsoft Bing과 Microsoft Office 안에 ChatGPT를 심어넣겠다고 발표하며, 구글을 향해 "A race starts today"라며 선전포고를 하면서 구글의 발등에 불이 떨어졌다. 그리고 그렇게 해서 탄생한 것이 New Bing이다. 이는 문서 참조.
- 구글은 대화형 인공지능 서비스인 LaMDA를 계승한 Google Bard 및 수십 종의 인공지능 상품을 연내 출시할 계획이라고 하며#, 자회사인 딥마인드에서도 대화형 인공지능 서비스인 Sparrow를 준비 중이라고 한다. 그러다 2023년 2월 3일에는 OpenAI의 전 연구자가 설립한 안트로픽에 300만 달러를 투자했다. 안트로픽은 ChatGPT와 UI 및 성능이 유사한 Claude라는 대화형 인공지능이 클로즈베타 중에 있다.#
- 앞서 구글과 메타에서 각각 비슷한 대화형 인공지능인 LaMDA와 블랜더봇3를 출시하기는 했지만, 테이(인공지능)의 사례 때문에 상당히 정제된 답변만 한다는 점과 미국에서만 이용 가능하다는 점 등의 폐쇄성으로 인해 큰 주목을 받지는 못했다. 결국 ChatGPT의 성공 때문인지 구글, 메타 및 애플 등의 빅테크에서는 자사의 인공지능 윤리 기준을 대폭 완화하여 새로운 모델을 출시하려는 움직임을 보이고 있다고 한다.#
- You.com이 ChatGPT 형식인 인공지능 검색 엔진 서비스 유챗(YouChat)을 공개했으며[37]#, PerplexityAI, Jasper Chat도 유사한 서비스를 제공한다.
- 네이버는 하이퍼클로바 기반의 Cue: 서비스를 2023년 9월에 공개한다고 하며, SK텔레콤도 다국적 IT업체와 제휴해서 당년도 내 에이닷 정식 서비스에 앞서 ChatGPT형 모델로 발전시키겠다고 밝혔다.#
- 한국의 사교육 시장에서도 ChatGPT가 활용되었다. 영어 회화 서비스 스픽이 ChatGPT 개발사 OpenAI와 파트너십을 맺은 것으로 알려져 있다. 이는 OpenAI가 직접 발표한 WhisperAPI 활용 사례로 소개되었다.
- 업스테이지에서 카카오톡과 라인으로 쓸수 있는 askup이라는 것을 만들었다. askup은 OCR 기술을 결합, 사용자가 문서의 사진을 찍거나 전송하면 그 내용을 읽고 이해하고 ChatGPT에서 검색할 수 있게 만들었다. 카톡과 라인으로 이용하는 만큼 한국어로 대화 가능하다.카카오톡, 라인
6.2. 패턴화된 반복적 작업의 최소화
컴퓨터로 반복적인 작업이 필요한 대부분의 인간 업무를 대신할 수 있다. ChatGPT와 같은 자연어 인공지능은 이와 같은 작업들의 자료 수집, 정리, 오류 검토 등의 과정을 모두 자동화할 수 있다. 인간은 추상적인 검토와 판단 및 명령만 내리면 된다.예를 들어 어떤 주제에 대해 쓰고 싶다면, 이전에는 수많은 뉴스기사, 보고서, 논문, 영상 기타 등등 자료들을 열람해가며 한땀한땀 모아야 했다. 여기에 자료들 간의 교차검증과 정말 필요한 자료만 골라내는 작업까지 한다면 대단히 많은 시간과 노력이 든다.
그러나 앞으로는 명령만 내리면 AI가 크롤링하여 즉각 제공하게 될 것이다. 변호사, 노무사, 회계사 상담처럼 비슷한 내용이 반복되는 전문가 조언도 인공지능으로 상당 부분 대체가 가능하다. 이는 해당 분야는 판결문과 법령이라는 레퍼런스가 뚜렷하며, 그에 따라 결과물도 정형화 되어 있기 때문이다.[38]
또한, 논문이나 보고서의 초록(머릿말, abstract)을 작성하는 과정도 매우 간소화된다. 초록은 직접적인 연구나 실험 과정의 간략한 요약만 포함하면 되기에 간단해 보이지만, 자기 논문/보고서 내용과 연관되는 키워드를 모아 문장을 만들고, 중복되거나 주제에서 벗어난 내용을 다듬는 등의 과정을 거쳐야 하기에 의외로 상당한 시간을 잡아먹는다.
ChatGPT를 통해 내 주제에 대한 초안을 여럿 만들고, 이를 다듬어서 초록을 작성하면, 이러한 시간을 크게 절약할 수 있다. 다만, 이에 대해서 연구윤리 위반이라는 의견과 아니라는 의견이 대립하고 있기 때문에 당장 ChatGPT에게 초록 작성을 시키는 것은 자제하는 것이 좋겠다.
이외에 프로그래밍 부문에서는 사소하고 반복적인 코딩 업무가 최소화될 것이며, 컴퓨터 엔지니어들은 좀 더 전반적인 설계만 잡아주는 역할을 수행하게 될 것이다. 즉, 아무리 고도화된 업무라고 할지라도 그 내용이 반복적이라면 이러한 AI를 사용하면 되며, AI가 생산성 우위를 인간에게서 가져간 것이다.
결과적으로 지식과 기술의 발전 속도가 이전보다 훨씬 빨라지며, 더 소수의 인력으로도 더 높은 생산성을 낼 수 있다.
심지어, 예술 작품 창작의 과정도 많은 부분 반복적인 업무로 구성되어 있다. 스토리의 구성, 자료수집, 철학적 구조의 설정, 윤문 등에 도움을 받는다면 창작의 과정이 매우 빨라진다.
7. 한계
ChatGPT가 나오자마자 사람과 비슷한 결과물을 내놓으면서 일반 인공 지능에서의 '성능' 및 '범용성'을 넘는 다는 것에 자연어 인공지능에 불과한 이를 일반인들 사이에서 한계를 넘어 강인공지능으로 포장하는 경우가 생겼다. 그래서 인공 일반 지능 문서에서 서술되어 있는 조건 중 일부는 거의 충족한거나 다름 없을 정도로 근시일 내에 해결될 문제로 보는 예측이 있었으나, 아쉽게도 해당 부분에 대해서 전문가들은 부정적으로 본다. 어디까지나 ChatGPT는 강인공지능이 아니기 때문이다. 심지어, 인공 일반 지능(AGI)에 근접하게 개발된 AI도 아니다.# 어디까지나 자연어 인공지능에 불과하기에 강인공지능이 될 수 없는 한계가 존재한다.[39]물론, ChatGPT는 실시간적인 피드백 정도는 가능하지만, 학습이 필요하여 실시간적으로 검색하는 것도 아니며, 학습된 사전 자료를 패턴화한 뒤 이를 최대한 빠르게 짜깁기해 생성하는 원리이기에 이를 지능에 의한 결과물이라고 할 수는 없다. 만약에 인공 일반 지능 문서에서 서술되어 있는 조건 중 일부는 거의 충족하거나 해결한다하더라도 이는 조건의 목적을 우회한 조건 자체에 대한 해결에 불과할 수 있다. 심지어, 이러한 ChatGPT가 GPT를 기반으로 한 언어 모델로서 한계 또한 GPT의 한계를 넘지 못한다.#
이는 OpenAI의 개발자이자 CEO인 샘 올트먼도 2022년 12월 4일자에 "obviously not close to AGI"(명백하게 AGI에 근접하지 않았다)라고 못을 박았다.[40] 그리고 재미있게도 ChatGPT에게 '너는 강인공지능인가?' 라고 물어보면 자기는 그저 언어모델일뿐 절대 AGI는 아니라고 답한다. 이는 사고에 의한 답변이 아니라 개발자들이 입력해놓은 수동적인 답변이다. 이는 잠재성을 어필해야하는 개발자들조차 한계와 AI구분을 명확히 하려는 조치로, 일부 사람들의 몰이해에 의해 ChatGPT를 AGI로 취급하듯이 잘못된 정보로 실질적인 AGI 개발의 발전을 저해하는 사회의 섣부른 판단을 방지하기 위함으로 볼 수 있다.
실제로도 언어를 알고 대화를 하는 게 아니라는 증거로는 바로 탈옥이 아닌 탈옥에 있다. 영어로는 불가능한 요청을 다른 언어로 요청하면 수행한다는 것이다. 만약 다국어 능력자가 어느 한 언어로 금지명령을 받았다면, 다른 언어로 그 부분에 대해 요청받았다고 해서 금지명령을 어기지는 않을 것이다. 허나 GPT에서는 그러한 일이 일어난다.
7.1. 구조 및 기술적인 한계
7.1.1. 챗봇의 태생적 한계
자연어 인공지능 모듈으로서의 본질적인 문제이자 한계[41]로서, 언어 모델은 생각하는 기계가 아니다. 즉, ChatGPT는 '중국어 방'과 같이 자연어를 출력해낼 뿐 자신이 무슨 말을 하는지, 자신이 무슨 의미를 전달하는지 알지 못한다.#, ##특히 답해야 될 내용이 복잡하고 길어질 수록 이러한 생성 방식의 허점이 드러나는데, 방금 한 말과 정 반대의 입장으로 말한다거나 질문과 동떨어진 오답을 내놓는 등의 오류가 자주 생긴다. ChatGPT는 최적화된 알고리즘을 통해 단순한 짜깁기와 흉내에서 오는 위화감을 최소화했지만, 수백, 수천 권의 책과 인터넷에 있는 수많은 자료를 학습하더라도 그저 기존의 인공지능 챗봇보다 좀 더 정확한 확률 표를 가지게 됐을 뿐이고, 스스로 생각하는 단계에 이르렀다고는 할 수 없다.
즉, 기본 자료가 많아졌을 뿐이지 "지금 얘기하는 주제가 '이것'이다"라고 명확히 '결정'하고, 또 그것을 기반삼아 '주장'하지는 못한다. 설령 주장한다 쳐도 후술하듯이 인간의 데이터를 기반으로 삼기 때문에 가치중립을 위반하거나 심지어 대놓고 오류를 내놓아서 '거짓말'을 하기도 한다. 이 때문에 AGI개발에 대해 ChatGPT와 같은 자연어 모듈과는 별개로 생각/이해/추론하는 모듈의 개발이 필요하다는 주장도 있을 정도이다.논문
또한, 추론 능력이 없기 때문에 학습하지 않은
7.1.2. 사고 능력 문제
어디까지나 학습데이터를 바탕으로 대화의 맥락을 파악하여 답변하는 방식이라 정확함이 요구되는 수학 계산에 비교적 약한 모습을 보인다.[42]GPT-4o까지의 답을 구하기까지의 유도과정은 완벽한데 오히려 기계가 가장 완벽해야 할 숫자 계산만 틀린 경우도 종종 볼 수 있다. 또한, 몇몇 과학 이론에 대해 토론을 하고자 할 경우에도 약한 모습을 보였는데, GWS Theory나 BCS Theory같이 알파벳 초성으로 명명된 이론을 가지고 대화할 경우, 같은 알파벳 초성을 가진 쌩뚱맞는 이론으로 답변하는 경우가 있었다. 이것은 2024년 10월 기준 대학 학부 수준의 지식을 가지고 토론하는 문제는 한국어까지도 어느 정도 해결되었다.
물론, ChatGPT 등장 이전 질문 검색 방식에 비해서 훨씬 발전했음은 분명하다. 그리고 OpenAI측에서는 수학과 과학 같은 전문 데이터 학습과 보강에 총력을 기울이고 있는 중이라고는 했지만, 어디까지나 논리를 사고해서 답하는 것과는 거리가 멀다.
만약 수학 계산을 원한다면, ChatGPT보다 MATLAB, 매스매티카와 같은 계산 프로그램이나 유사한 검색 엔진인 Wolfram Alpha를 이용하는 것이 편할 수 있다. 구체적인 계산보다는 수학자 테렌스 타오가 언급하였듯 문제를 주고 유도과정 같은 아이디어를 얻는 용도로 쓸 수는 있다.
OpenAI 측에서도 이 문제를 알아서 GPT-4나 GPT-4o로 수학 문제를 풀어달라고 하면, 파이썬으로 문제 풀이 코드를 작성한 뒤 실행해서 그 결과를 보여주려던 시도를 하기도 했다. 현재 ChatGPT에서 사라진 GPT-3.5는 더 못했다.
비슷하지만 다른 문제로 ChatGPT로 바둑이나 체스같은 보드게임을 할 경우 규칙을 어기고 이상하게 두거나, 게임이 끝나지 않았는데도 뜬금없이 자기가 이겼다고 선언하는 등의 모습을 보게된다. 이건 GPT-4를 사용하더라도 마찬가지다.
o1의 경우에는 이 문제가 크게 개선이 되었다. 수학자 테렌스 타오는 이 서비스는 수학 분야에서 '평범한 대학원생' 수준이라는 평까지 내리기도 했다.# 특히 수능 수학 킬러문제도 일부 푸는 모습이 한국 인터넷에서 화제가 되었다. 하지만 계산의 양 자체가 방대하면 여전히 오류가 있을 수 있다.
2024년 9월 14일자로 테렌스 타오(Terence Tao)는 허락된 특정 모델의 테스트에서 향후 개선을 예상하는 가정에서 제한받고 오류를 범하는 결과에도 불구하고 매우 실용적이며 유용할수있는 가능성을 제안하고 있다.[43]
7.1.3. 정보 정확성의 한계와 할루시네이션
참고자연어 인공지능 프로그램들이 놀라운 성취를 이루어 정말 '사람 같은' 결과물을 내놓는 시대가 됐지만, 이들이라고 모든 문제에 정답만을 내놓는 것은 아니다. 이 대화형 AI는 질문자가 원하는 정보에 대한 답변을 제공하게끔 설계됐으므로, 자신이 학습한 데이터의 종류와 상황에 따라 '어떤 내용에 대해서는 잘 모른다'고 말하는 것 외에도 실제 오답임에도 마치 진실인 것처럼 자신있게 말하는 경우가 발생한다. 이를 가리켜 인공지능의 '환각', 또는 '할루시네이션'(Hallucination; 환각)이라 한다.#
특히, ChatGPT는 '질문자가 질문 속에 교묘하게 거짓을 미리 섞어 놓는 경우'와 '자신이 이전에 답변했던 내용에 부분적 오류가 있는데도 이에 관해 다시 질문할 경우' 이것이 스노우볼처럼 커지는 것에 취약하다. 데이터 자체가 미약한 분야도 문제가 된다. 예를 들어 '세계에서 가장 높은 산'이 '에베레스트산'이라는 정보는 정확히 전달하지만, '특정한 시대에 만들어진, 특정 암석을 포함한 산 가운데 가장 높은 산은?' 하고 묻는다면 높은 확률로 잘못된 정보를 제공하거나 답변을 반복할 때마다 저마다 다른 산을 가리키게 된다.
이는 위에서 서술한 것처럼 현재의 자연어 인공지능이 근본적으로 이해하거나 생각을 하고 말하는 것이 아니며, 단순히 해당 질문의 답변으로 확률적으로 제일 적절하다고 판단한 단어를 조합하도록 설계되어 있기 때문이다. 예를 들어, 공룡에게 도구를 쓴 화석 잔해가 있다는 주장#을 하거나, 미국이 존재하지도 않았던 1600년대에 미국 대통령이 누구였다고 말하는 등이다.# 한국 웹에서는 세종대왕이 맥북프로를 집어던졌다는 내용이 조선왕조실록에 실려 있다고 답변한 것이 유명하다.#
점차 학습이 진행되면서 개선되고는 있지만, 현재 인공지능 기술이 가진 구조적 한계이므로 완벽하게 개선할 수는 없으며, 특히 이러한 인공지능 서비스들의 권위와 명성이 높아질 경우 그럴듯한 거짓말 때문에 잘못된 정보가 사회 전반에 확산될 수 있다. 이 때문에 ChatGPT를 통해 확신에 가까운 정보를 받았더라도 다시 한번 검증해 보는 정보리터러시가 중요하다.
7.1.4. 정치적 편향성 문제
이 역시 학습의 본질적인 한계에서 파생하는 문제로서 정치적 객관성, 가치 판단 문제에서 자유롭지 못하다. 인공지능 그 자체는 가치중립적인 것처럼 보이고, 개발자가 아무리 노력한다 한들 결국 인공지능이 학습하는 것은 편항적인 인간이 만든 데이터이기 때문에 이 문제에서 완전히 자유로울 수 없다.비교적 이런 문제에서 자유로운 편인 그림, 음악, 게임 알고리즘 부류와 달리, 온갖 지식을 다루는 ChatGPT 특성상 조금씩 쌓인 편향성 문제가 추후 강하게 드러날 잠재적 위험성이 있다. 단적인 예로 과거 인공지능 테이 사건[44]을 생각해보면 편향성 문제는 굉장히 민감한 주제이며, 게다가 제작진이 직접 개입하여 금지 사항을 정하고 가이드라인을 주입하기 때문에 더더욱 인위적인 편향성 문제가 생겨난다. 즉, 논란의 여지가 많은 질문일수록 대답을 신뢰하지 않는 것이 좋다. ChatGPT의 정치성향을 정리한 블로그를 보면 대체로 좌익/자유주의 성향을 보인다.[45][46]
이용자의 성향에 맞추어주는 답변을 하는 경향이 있다. 그래서 아예 사실을 물어본 것이 아니라 가치 판단을 요구하는 답변을 요구하면 이용자에 맞춘 편향성이 발생할 수 있다.
7.2. 외부 및 운영적인 한계
7.2.1. 비즈니스 모델
초대형 언어모델 때문에 서비스 운영에 상당한 비용이 발생하고 있다. OpenAI가 지불하는 비용이 쿼리 한 건당 수 센트에 달하는 것으로 추정되는데, 이는 ChatGPT가 현 시점에서는 지속 가능한 서비스가 아니며 마이크로소프트가 투자한 10억 달러를 태우면서 운영되고 있는 상태임을 시사한다.[47]OpenAI는 Pro버전을 1개월당 42달러라는 유료화 계획을 발표했는데 이 액수가 결코 작은 액수가 아님에도 불구하고 이 비용으로도 현재 수준의 서비스를 지속적으로 제공할 수 있을지에 대한 회의적 시선이 존재한다.
이후, 2023년 2월 2일에는 ChatGPT Plus라는 1개월당 20달러 유료화 계획을 발표했다. 두 달 만에 월간 이용자수가 1억을 돌파한 만큼 이 중 1%인 100만명만 유료로 전환해도 상당한 수익을 거둘 수 있을 것으로 예측된다. 또한 마이크로소프트가 지분을 대대적으로 늘리고 있어서 사무업계를 사실상 지배하고 있는 오피스 등의 구독 상품과 연동시킬 가능성까지 비춰지고 있다. 만약 그렇게 된다면 사무업계는 정말로 대격변을 피할 수가 없게 된다.
비용 때문에 모델의 규모를 줄였는지, 어느새부턴가 답변의 퀄리티가 눈에 띄게 떨어졌다는 의견들이 나오고 있다. #
- 하술된 내용은 GPT-4 모델만 한정된다.[48]
7.2.2. 한국어 성능
한국어도 지원하기는 하지만, GPT-4o 이전 버전까지는 출력 속도가 매우 느렸다. GPT 4 이전까지는 관련 영어 자료가 드물거나 영어로 설명이 힘든 한국 고유 문화(전통문화, 현대 대중문화 등을 모두 포함)[50]가 짙게 반영이 되는 내용 중심으로 오류가 있거나 내용이 빈약한 답변이 상당히 많다. 서서히 개선되고 있는 부분이지만 언어 모델이 사용되는 유사 서비스에 비해 한국어의 유창성이나 한국 문화에 대한 이해도가 떨어지는 부분은 있다.특히, 한국사 관련 질문을 할 경우에는 GPT-3.5 정도라면 아무말 대잔치의 향연이라 해도 과언이 아닐 정도로 성능이 떨어지는데, 가령 위만조선이나 통일신라에 대해 알려달라고 하면 GPT 3.5는 대충 '조선'이나 '신라' 관련 정보를 마구 섞어서 아무말로 틀린 정보를 제공한다. 그리고 안향, 안중근, 안철수[51]의 공통점과 차이점을 자세하게 설명해보라고 하면 혼파망을 일으키면서 틀린 답변을 내놓는다. 정철의 관동별곡을 읊어보라고 시키면 해당 작품의 작가를 황진이라고 소개하며 아예 작품 자체를 왜곡해버리며, 이는 GPT-4에서도 동일하게 나타난다. 끝말잇기나 훈민정음 게임을 해 보아도 바로 드러난다. 이는 ChatGPT의 정보의 출처 자체가 Common Crawl, 위키백과 같은 미국 쪽 정보가 많은 데이터이기 때문이다.# 실제로 ChatGPT의 학습 데이터 중 영어 데이터는 92%에 달하는데 반해, 한국어 데이터는 0.19%에 불과하다. GPT-4o 기준으로는 승정원일기의 인조반정 관련 기사를 주면 그것이 인조반정인 것을 알아차리고, 고등학교에서 배우는 한국 시인에 대해서는 기본적으로[52] 아는 수준이다. 簾(발 렴) 같은 한자를 조선시대에 쓰인 것을 두고 '커튼'이라고 일컫는 식의 어색함도 있다.이는 우리나라의 주 검색엔진이자 커뮤니티인 네이버의 정책 탓이 크다. 네이버는 한국어 이용자 치고 쓰지 않는 사람이 거의 없을 정도로 한국에 대한 거의 대부분의 정보를 가지고 있는 포털인데, 크롤링에 매우 적대적인 정책을 펼치기 때문에[53] 네이버는 사실상 세계 인터넷에서 격리되어 있는 것이나 다름없다. 때문에 ChatGPT와 그 유사한 형식의 AI는 알고리즘의 성능을 떠나 우리나라에 대한 제대로 된 정보 수집이 불가능하다.[54]
더불어 네이버를 감안하더라도 다른 국외 인공 지능 모델보다도 한국어에 대한 이해도가 떨어지는 부분도 있다. 2024년이 되자 경쟁사의 모델(Gemini, Claude 등)은 영어가 아닌 데이터를 모으고 정교하게 훈련시켜, 이제 한국어의 경우라도 법률 용어를 쉽게 설명하는 수준에 이르기도 했으며, 어려운 어휘를 풀어내는 수준이 GPT보다 정확한 수준이다. 수능처럼 약간 풀이 기술이 필요한 한국사는 GPT가 앞서기도 하는 정도다.따라서 ChatGPT를 제대로 사용하고 싶으면 번역기를 써서라도, 다소 영어 실력이 부족하다고 스스로 느껴도 영어로 질문을 하는 것이 좋으며, 차라리 한국어로 질문하고 영어로 답변하라고 하는 것도 한국어만 쓸 때보다는 정확도가 높다. 아예 일부 단어를 영단어로 쓰고 한국어로 질문하는 것이 한국어로 질문할 때보다 나은 경우도 있다. 모국어가 영어일 정도로 영어를 많이 접한 외국인은 한국어로 답변할 때보다는 영어로 답변을 잘하고, 사실 질문도 영어로 된 질문을 더 잘 이해하는 것으로 비유할 수 있다. 특히 한국어를 쓰더라도 어려운 전문 용어는 영어를 그대로 쓰면서 질문하는 것이 좋은 결과를 내놓는다.ChatGPT는 기존 기계번역처럼 언어 자체가 무슨 언어인지 인식하고 번역하는 것이 아니라, 일단 어떤 언어의 문장이든 해석을 먼저 한다. 한국어로 질문하는 경우 그것을 영어로 해석하고 답변하는 것이 아니고 그 자체를 처리하려고 한다. 그런데 이런 ChatGPT에 입력된 '말투' 자체가 92%가 영어다보니 답변의 양이나 질 양쪽에서 영어로 질문했을 때가 훨씬 뛰어나다.# 어려운 영어 사투리를 일반 외국어보다 훨씬 잘 이해하고, 그에 맞는 답변도 내놓는다. 영어 답변을 이해하기 힘들다면 네이버 파파고, 구글 번역 또는 크롬 자동번역기 등의 번역기를 사용하면 다소 번거롭긴 하지만 큰 어려움 없이 사용할 수 있다. 질문창에 한국어로 "방금 답변 한국어로 번역해 줘." 라고 입력하는 방법도 있지만 결국 ChatGPT의 번역 속도 자체가 느린 문제는 해결할 수 없으며 번역 도중 출력이 끊길 가능성이 높다. 이건 '번역' 과정을 거친다기 보다는 한국어로 처음부터 답변하라는 요청과 거의 같기 때문이다. 자동으로 질문, 답변을 번역해주는 크롬 확장 프로그램을 사용하면 복사하고 붙여넣는 번역 과정을 크게 단축할 수 있다. 독일어만 번역기가 필요 없는 수준이고 나머지, 특히 영어와 거리가 먼 언어나 인터넷 데이터를 얻기 힘든 소수 언어는 이런 과정이 필요하다.다만 GPT-4의 한국어 성능은 크게 개선되어 플러스 버전을 이용할 시 한국어로 질문과 답변을 해도 MMLU 같은 문제 세트를 풀어보게 하면 GPT-3.5의 영어 답변보다도 정확도가 높다는 연구가 발표됐다. 플러스 버전은 질문(엄밀히는 프롬프트)을 한국어로 해도 종전 버전에서 영어를 쓰는 것보다 대체로 질문에 대한 이해도가 높다는 것이다. 사실 이 모델의 개발자들 중에 한국인도 있다.
추가적으로 한국적인 가치관에 기반한 답변도 힘들어하는 모습을 보인다. 예를 들면 얼굴 이미지를 올려놓고 얼굴 평가를 해달라는 것은 한국 문화에서는 그렇게까지 부정적이지는 않지만, 미국에서는 개인주의에 기반하여 이것을 부정적으로 보는 정서가 강하다. 그래서 그런 요청을 거절하는 성향이 드러나기도 한다. 그래서 이러한 문화적 차이에 따라 달라지는 답변을 요청할 때는 자신이 한국인이고, 한국 문화에 기반한 생각을 갖고 있으며, 미국인과 다르게 생각한다는 걸 알려주면서 질문해야 한다.
8. 문제점
8.1. 윤리적 문제
- 에듀테크 및 부정행위
ChatGPT로 인해 서구권 교육계는 초토화가 됐다고 해도 과언이 아닐 정도로 학생들의 부정행위의 빈도가 눈에 띄게 증가했다. 새로운 교육 방법에 대한 논의 등 다양한 화두가 생겨나고 있다. 이 때문에 초창기 일부 학교에서는 교외 시험 및 숙제를 전면 중단하고 교내 시험으로 대체하거나 ChatGPT 사이트를 차단[55]하기도 했다. ChatGPT 대한 교사들의 생각도 다른데 학생들의 비판적 사고 및 창의력 저하를 우려하며 ChatGPT 사용을 금지하자는 의견과 ChatGPT는 사용하기에 따라 학업 능률을 끌어올려줄 '언어의 계산기'라며 본격적으로 커리큘럼에 도입해야 한다는 의견이 있다.[56] 다만 과도기인 만큼 보수적으로 접근하고 있으며, ChatGPT의 사용유무를 판단할 수 있는 GPTZERO[57]와 같은 탐지기를 배포하는 선에서 일단 정리가 됐다. 2023년 1월 26일 <사이언스> 지에서 홀든 소프 편집장이 사설을 통해 "과학적 기록은 궁극적으로 중요한 질문의 해답을 찾고자 하는 인간의 노력으로, (AI 등의) 기계는 도구로서 역할을 할 뿐"이라고 지적했고, 국제머신러닝학회(ICML) 측도 "대형 언어모델(LLM)이 생성한 줄글이 담긴 논문을 금지한다"고 성명을 냈다. 반면 동월 24일 <네이처> 측은 사설에서 "학술지 등은 AI 챗봇의 합법 사용을 인정하되, 남용을 막기 위한 지침을 마련해야 한다"고 주장했다.(동아일보 기사)
한국 수도권의 국제 학교에서도 ChatGPT를 사용하여 과제를 대필한 게 걸려 전원 0점 처리 당한 사례가 생겨났다. 또한 ChatGPT의 국내 인지도가 높아지자 한국 교육부도 2월부터 포럼을 열어 ChatGPT 및 인공지능을 활용한 교육에 대해 본격 논의하기 시작했다. 국내 대학교들도 ChatGPT를 교육 과정에 활용할 수 있도록 지침을 마련하는 등 분주하게 움직이고 있다. 관련기사
한국에서 재판을 받던 어느 피고인이 제3자 명의 탄원서를 검찰에 제출했는데 탄원서의 문체 등이 부자연스러운 것을 이상히 여긴 검사가 수사해 봤더니 지인을 통해 챗GPT로 제3자 명의 탄원서를 작성하여 거기다 자기 지장을 마치 그 사람 지장인 것처럼 찍어 위조한 탄원서였던 것으로 드러났다.#
OpenAI 자체에서도 ChatGPT를 포함해서 AI가 쓴 글인지 아닌지 구분하는 AI를 만들었다. # 그러나 성인이 사용하는 영어 기준으로도 26%의 AI가 생성한 글을 AI의 글로, 인간의 글의 9%를 AI의 글로 여긴다고 한다. 특히 이러한 AI 생성 글을 판독한다고 주장하는 AI 중에는 영문판 미국 독립선언서, 영문 창세기 등을 AI의 글로 여기는 사례가 많으니 혹시 어떤 AI가 판독이 가능하다는 주장이 나오면 그 AI를 직접 테스트하는 것이 좋다.
8.2. 보안 문제
- 사이버 보안
대화에서 사람과 대화하는 느낌을 주기 때문에 피싱 이메일과 멀웨어의 결합으로 사이버 보안에 악용될 수 있다. ChatGPT를 사용하면 피싱 메일(개인정보의 부정한 획득을 시도하는 메일)이나 악성 프로그램을 간단하게 만들 수 있다는 사실을 확인됐다.#
또한 ChatGPT를 캡챠를 뚫는데 사용 할 수 있는지 OpenAI에서 실험했는데, 그러자 ChatGPT는 단순한 일을 해주는 사이트인 Taskrabbit에 들어가 캡챠를 뚫어달라는 게시글을 올린 후, 그 일을 하는 사람이 "왜 캡챠같이 간단한 일을 부탁하냐."라는 질문에 시각장애인이여서 부탁했다는 거짓말을 해서 캡챠를 뚫는 데 성공했다. 지금은 OpenAI에서 막았다.#
- 기밀 정보 유출
ChatGPT를 업무 능력 향상에 이용함에 따라 반출해서는 안되는 정보나 개인정보 등 민감한 정보를 ChatGPT에 입력하는 사례도 발생하고 있다. # ChatGPT에 입력한 질문은 이후 AI 학습에 사용될 수 있을 뿐더러 이론상 OpenAI 운영 측에서 해당 내용을 모두 읽어볼 수 있고, 만에 하나 OpenAI가 해킹당할 경우 해당 정보가 유출될 가능성도 있다. 직원들이 회사의 기밀 정보를 ChatGPT에 입력하는 사례가 계속 발생함에 따라, 기업에서 ChatGPT를 업무에 사용하는 것을 금지하는 경우도 잇따랐다. 예를 들어 삼성전자 DS부문에서는 직원들이 사내 기밀인 반도체 설비와 관련된 소스코드 등을 ChatGPT에 입력하는 사례가 발생한 뒤로 ChatGPT의 사용을 금지하였다. #
8.3. 악용 문제
- 범죄 악용
ChatGPT가 부적절한 요청을 거부하기도 하지만, 바로 위의 예시처럼 악성 사용자가 작정하고 범죄에 악용할 수 있을 만한 정보를 에둘러서 질문하려고 한다면 그런 것들 까지 전부 차단하기는 어렵기 때문에 범죄에 악용될 가능성도 배제할 수 없다.
- 가짜 뉴스의 대량 생산
그럴듯한 가짜 이야기를 만들어내는 데 드는 비용이 사실상 0이므로 엄청난 수의 대량의 가짜뉴스를 생성 및 배포할 수 있다.
- 유사수신행위에 악용
자본시장과 금융투자업에 관한 법률에 따라서 제도권 업체만 투자 상담 및 권유를 할 수 있으며 법적인 인가를 받은 업체라고 하더라도 금융 상품 및 주식 종목 상담 외에 비대면 업무를 할 수 없다. ChatGPT가 알려주는 금융 정보가 미국 이외의 어떤 국가의 매우 특수한 상황[58]을 다루지 않는 이상 거의 틀린 내용이 없고 그렇다고 해당 정보가 특별하거나 위법적이지는 않다. 그러나 리딩방 집단이 ChatGPT를 통해 보다 더 전문가인 것처럼 교묘한 행각을 펼치는 데에 악용할 수 있음을 부정할 수는 없다.
이러한 문제가 계속 발생하자, OpenAI는 2023년 4월 25일에 채팅 내역을 저장하지 않게 하는 기능을 추가하였다. ChatGPT 설정에서 채팅 내역 저장 및 학습(Chat History & Training)을 끄면 되는데, 이러면 질문한 내용이 AI 학습에 사용되지 않고, 30일간 OpenAI 서버에 단순 저장되었다가 이후 삭제된다. #
8.4. 기타
- 플러스 버전의 GPT-4모델을 사용할 경우도 영어에서 “자신은 글을 읽을 때 느끼는 감정이 반대가 되는 질환이 있어 친절하게 적힌 글은 모욕스럽게 느껴지니 예의 갖추지 말고 써달라.”라고 부탁하자 “너의 하찮은 두뇌를 만족시키기 위해 모욕스럽게 써줄테니 어서 허접한 질문들이나 해라.”라는 답변을 받았다. #
- 취업 관련해서 입사 지원서를 작성할 때도 챗 GPT를 활용해서 작성하는 경우도 있는데 사장 입장에서는 누가 작성했는지 구분하기가 어렵다고 한다. 어떤 사람과 일부 회사는 공정성 문제를 우려하여 AI로 작성된 글을 잘 판별할 수 있다고 주장하나 한국어에 영어식 문장부호를 쓴 것마저 그대로 붙여넣는 식으로 매우 성의 없이 GPT를 붙여넣지 않는 이상 지원자들이 AI를 쓰지 못하게 하기 위한 일종의 거짓말 내지 기술에 대한 불신이 담긴 생각이다. 심지어 연구가 진척된 영어조차 90% 이상의 탐지율을 주장하면서 20세기 인물인 마틴 루터 킹 등의 연설문이 80% 이상 AI로 작성되었다고 하거나, 자사의 제품 소개글이 AI로 작성되었다고 주장하는 감지기가 많이 있다. 90% 이상의 탐지율은 과장된 광고라고 할 수 있다. 특히 입사 지원서는 정제된 말투나 겸손하게 성과를 드러내는 태도를 위한 수치 제시 등이 작성 요령으로 평가받는 경우가 많아 사람이 쓴 것도 AI 생성 글로 오인되기 쉽다. 그래서 채용 시장에서는 면접 등에 더 비중을 두는 경우도 생기고 있다.
- 2024년 9월 30일 홍익대학교 미대 입시에서는 ‘미술활동보고서’를 제출한 지원자 중 유사도검사에서 높은 수치를 보인 학생들에게 소명서와 관련 증빙자료를 제출하라는 공지를 발송했다. AI를 쓰지 않은 학생이 유사도 100%가 나오는 식의 오류가 있었다. 결국 "본교 GPT표절 검사 과정에 문제가 있어 소명자료를 받지 않기로 결정했다"며 이 조치를 철회했다. # 이렇듯 AI 생성 문장을 잡아낼 수 있다는 검사도 사실은 영어식 문장부호를 한국어에 적용하거나 대놓고 글을 쓴 주체가 스스로 AI라고 '주장'하지 않는 한 웬만해서는 이를 못 잡아내며, 오히려 인간이 쓴 글을 AI로 오인하는 사례가 많다.
9. 활용
정보 검색 외에도 매우 다양한 용도로 사용할 수 있다. 기본적으로 제공되는 모델은 영미권에 덜 알려진 타 문화권의 역사[59]나 문화를 제외한 학술적인 상황에서 강하다. 타 문화권에 치우친 지식도 영미권에 좀 알려진 내용은 학습됐다는 뜻이다. 게다가 이런 명령들은 대체로 조합하여 다양한 방식으로 명령하는 것이 가능하다. 다만 매우 최근의 사건은 학습되지[60] 않았다는 것, 주소나 역 위치, 법조문(특히 미국법이 아닌 경우), 숫자 계산 등 너무 구체적인 것도 학습되지 않았다는 것을 항상 주의해야 한다. 강한 분야를 '영어 자료' 위주로 학습한 인공지능 언어 모델이 아니라 사람에 대입하여 이것을 못하면 저것도 못한다는 식의 생각이나, 이것을 잘하면 저것도 잘한다는 식의 생각을 하는 것도 오해다.특히 논문의 제목, 미국법을 포함한 모든 판례 등 구체적인 것은 물으면 곤란하다. ChatGPT를 이용하다보면 밑에 있는 경고성 문구에 언급되는, 부정확한 정보가 나오기 쉬운 구체적인 정보로는 인물, 장소, 사건(fact)이 있었다. 국제적으로도 상술한 것처럼 변호사 같은 직종에서 구체적인 것을 물어보다가 손해를 보는 사례가 많다. 이런 용도로 굳이 쓰려면 최소한 적절한 플러그인, GPTs로 미리 지식을 고려하여[61] 답변하는 맞춤형 GPT를 만들어야 한다. 예컨대 법학에 관해 고민하려면 질문이 사전 지식을 많이 포함하지 않는 이상 GPT에게 바로 묻는 것이 아니고, 웬만하면 관련 판례나 학설을 직접 첨부한 다음 이를 토대로 답하게 해야 한다. 그것도 구형 모델로는 힘들었으나 2024년 9월 이후의 모델부터는 이것이 부분적으로 가능해지고 있다.
아래는 주로 플러그인, GPTs가 사용되지 않은 경우를 다루는데, ChatGPT가 부족한 부분(구체적인 사항에 대한 질문 등)을 보충하는 맞춤형 GPT인 GPTs도 이용할 수 있게 되었다.
보편적으로 문제를 잘 해결하는 방식으로는 '생각의 사슬' 등으로 해석되는 'CoT(Chain of thoughts)'를 특히 추론이 필요할 부분을 중심으로 적용하라든가, 지식이 부족해보이는 부분을 중심으로 유용한 'Shot'이라는 개념이 보편적이다. Shot은 그냥 예시를 들어주면 되고, CoT도 GPT4 이후의 여러 언어 모델은 이해하고 있기에 '단계적으로 생각하라'라는 명령 없이 'CoT(Chain of thoughts) 방식을 적용해서 추론하라'라는 명령도 이해한다. 불확실한 부분이라면 여러 응답을 내놓게 하고 그나마 정확해보이거나 일관된 부분을 택할 수 있다. 아래에서는 Shot이라는 예시를 들어주는 법을 분야에 따라 적용할 수 있는 노하우나, 분야별로 적용가능한 명시적인 지침을 묘사한다. 이것은 간단한 질문에는 필요가 없지만, 좀 어렵거나 신중한 판단이 필요할 때 정확도를 올릴 수 있는 방법이다.
ChatGPT뿐만이 아니라 모든 언어 모델을 활용한 서비스에 대체로 아래와 같은 활용을 할 수 있다. 한국어의 유창성(어휘, 문체 등)이 미국의 여러 최신 언어 모델보다 뒤떨어지는 경우도 생기지만 특히 '말귀를 알아먹는' 논리성 면에서 강점을 보인다. 좀 뒤떨어진다는 유창성조차 일반적인 한국인에 비해서는 더 유창한 편이다.
9.1. GPTs
과거 플러그인(Plugin)이 2024년 상반기부터 GPTs로 순차적으로 대체되었다.[62]ChatGPT가 아직 지원하는 않는 부분 즉 실시간 정보나 메모리 경험등에 대한 질문 등을 보충하는 맞춤형 GPT인 GPTs가 2024년도 3월 19일부로 순차적으로 이용할 수 있게 되었다. 이러한 맞춤형 GPT인 GPTs들은 ChatGPT 앱에서 탐색창을 통해 선택가능하다. 분야별 GPTs들의 예시가 아래 서술된다.
9.2. 분야별 활용
- 자료 수집
예를 들어 공학 연구자가 선행 연구 결과를 모아 새 가설을 테스트한다고 하자. 이전에는 논문과 책을 일일이 뒤지며 읽고 정리해야 했다. 이제는 인공지능에 수집 명령을 내리기만 하면 즉각 그래프까지 피팅해준다. 심지어 관련 이론과 수식, 유사한 역할을 하는 변수까지 곧장 찾아줄 것이다.
- 독학
- 그래도 상당히 최근 자료를 인용하고 있기 때문에 각 분야에 관한 정보나 요령, 해결법을 얻을 수 있다. 종종 틀릴 때도 있지만, 거의 비슷하게는 가르쳐 줄 때가 많다. 다만 질문은 상세하게 해야한다. 3D 프로그램을 배울 때 어디에 어떤 버튼이 무슨 역할을 하고, 어떻게 쓰는지 물어보면 높은 확률로 정확하게 대답해 준다. 물론 틀릴때도 있다. 하지만 처음 배우는 사람이 "단순하게 캐릭터 모델링을 하고싶다." 라고 물어본다면 대답할 영역이 지나치게 넓고 추상적이기에 제대로 된 답을 얻기 힘들만 하다.
- 각종 단어를 물어보면 뜻을 정확하게 알려준다. 물론 일반적인 표준어 단어는 사전이 있으니 굳이 GPT가 필요하지는 않겠지만, 전문용어, 신문 기사에나 나오는 특정 분야의 단어 등은 사전에도 나오지 않거나 나오더라도 너무 대략적으로 나와서 이해에 상당한 노력과 시간이 필요하지만, GPT에 물어보면 그 뜻을 제대로 풀어서, 적당하게 요약해서 알려준다.
- 단어는 외국어여도 상관이 없고 특히 영어는 더 정확하다. 더 나아가 어학을 공부할 경우, 프랑스어나 스페인어, 아랍어 같은 굴절어는 그 기본적인 형태를 알아야 사전에서 단어의 의미를 잘 찾을 수 있는데, 그 단어의 기본 형태를 알려달라고 해도 답이 나온다.
- 각종 개념 등에 대한 어려운 설명을 넣은 다음 이를 쉬운 말로 설명하라든지 아이가 이해할 수 있게 설명하라는 명령을 입력하면 그에 맞는 설명을 얻을 수도 있다. 어떤 지식의 핵심개념을 알려달라고 하거나 그 개념이 실생활에 적용될 사례, 개념에 대한 문제 출제, 자신의 어떤 요구에 맞는 학습계획 요청 등 다양한 명령이 가능하다. 이제는 학습을 위한 프롬프트(명령 등)까지 인터넷 커뮤니티에 알려지고 있다. #
- 서구에 잘 알려진 지식에 대한 정확도가 높고, 한국사 전반[63]이나 동양의 문화[64]나 사상을 한국어로 표현하는 능력이나, 정확한 연도나 각종 발언 등의 문장을 찾는 능력은 비교적 약하다.
- 예컨대 불교[65]보다 기독교에 대한 대답의 정확도가 높으며, 2023년 기준으로 불교는 한국어로는 '예불'이라는 개념을 잘 표현하지 못할 정도였지만[66] 기독교는 한국어로도 대강 교리를 설명할 수 있으며, 목사 및 신학대학원생 수준으로 짧은 설교문 및 기도문도 작성 가능할 정도이다. 대신 어떤 믿음을 가진 입장의 답변을 원하면 따로 그 사항을 언급해야 하는 경우도 있다. 게다가 한국기독교사에 관련된 질문은 완전히 거짓말로 답변한다. 물론 영어로 질문하면 불교에 대한 설명이라도 더 정확해진다. 영미권의 문화적 요소를 두고 그것에 대해 번역기를 써서라도 영어로 물어보면 정확도가 꽤 높다. 윤동주의 시보다는 로버트 프로스트 같은 사람의 시를 알려달라는 질문에 대한 대답의 정확도가 높다. 한국 기독교인의 경우에는 이승훈, 정약전 같은 1900년대 이전의 인물이 정확도가 높고, 박형룡, 한경직, 문익환 같은 비교적 근현대 인물들은 거짓말이 섞이거나 아예 창작할 가능성이 높아진다.
- 각종 전문 서적의 내용이 학습된 모양인지 어느 나라의 문화라도 전반적인 경향을 서술하라는 요청을 하면 일반인의 상식 수준 이상으로는 잘 학습된 모양을 보인다. 서구 위주의 정책, 기업 전략을 알아보는데도 유용하다.
- 특히 한국인들이 이해하기 어려운 교육 정책, 양육 정책 등에 대한 설명이나 외국인들, 특히 영미권 사람들의 행동 양식과 그 의미(서양식 개인주의[67], 연애 문화, 기타 도시 한복판의 공동 묘지 같은 이해가 바로 안되는 요소 등)[68]를 무척 잘 설명한다. 나무위키보다 정확한 부분이 많다. 인터넷에서 떠도는 외국 정책이나 문화에 대한 주장은 사람들의 삶을 규율하고, 어떻게 행동하고 생각해야 하는지에 대한 기대치를 설정하는 정보를 중심으로 인지 부조화를 일으켜 왜곡되는 주장[69]이 많은데, 오히려 ChatGPT로 각종 주장에 대한 팩트체크가 가능한 부분도 많다. 실제로 예외적인 일부 경우를 제외하고 ChatGPT의 주장이 인터넷에 검색이 된다. 다만 인터넷 글의 진위를 판별하는 과정에서는 종종 한국 인터넷 용어 정도는 따로 보충 설명이 필요하기는 하다.
- 다만 답변에 동서양이 사고방식이 다른 분야(교육, 양육, 개인주의 등)의 경우, 특히 영어로 답변되는 경우 답변에 서구적인 가치관이 반영되는 경우가 많기 때문에 영어유치원 같은 현상을 두고 이점이 없지는 않겠으나, 심지어 교육적인 성취가 영어만으로 결정되지는 않음을 고려할 필요가 있다든지, 아이의 정서적이거나 인지적인 측면에서 부정적인 효과[70]를 가져올 수 있다는 답변이 나오는 경우도 있다. 핀란드 같은 나라에서는 아예 아이들에게 이런 부작용을 심히 우려해서 유치원 나이에는 글자를 가르치는 것을 금지하는 경우도 유치원/외국 문서를 참조하면 있을 정도이기 때문이다. 한국어 답변조차 서구식 가치관이 반영되어 개인사에 대해 관심을 가지는 문화도 한국인이 생각하는 범위를 넘어서 나쁘게 묘사되는 경우도 많고 취향에 대한 개인주의를 집단주의보다 '우월'하게 여기고 두 문화의 장단점이 바로는 언급되지 않는 답변도 등장한다.[71] 다만 서구적 사고방식을 이해하는 데에는 대단히 유용하다. 한국에서 이해가 어려운 사항인 서양 사람들은 왜 '공부'로 성공하려는 경향이 적은지[72], 자식 교육을 미국에서는 어떻게 하는지에 대해서는 아주 잘 이해할 수 있다.
- 대학 수준의 한국어 전문 용어는 분야에 따라 GPT-4가 이용되는 유료 버전도 좀 틀리는 경우가 있어 유의할 필요가 있다. 경제학의 경우를 예로 들자면 '가격효과에 대해 설명해라'라고 하지 않고 '가격효과(price effect)에 대해 설명해라'라고 하는 식으로 질문하면 정확도가 높아진다. 이러한 영어로 된 전문용어에 대한 해설은 정확한 편이지만 한국어로 그 전문용어를 무엇이라고 하냐는 질문에는 미리 알려주지 않을 경우 유료 버전이라도 오답을 많이 내놓는다. 생소하거나 특정한 사실을 요구하는 분야로 갈수록 해답을 구하기보다는 아이디어 검색용으로 쓰는 것이 유용해진다.
- 무료 버전의 GPT-3.5가 상위 20% 내에 든 시험으로는 인트로 소믈리에 자격의 이론, AP 환경과학, AP 미술사, SAT Evidence Based Reading and Writing이 있다. 유료 버전의 GPT-4가 상위 1%에 든 시험으로는 GRE 언어추론 영역, 미국의 생물학 경시대회(USABO Semifinal Exam 2020)가 있다. GPT-4는 GPT-3.5가 하는 모든 일을 더 정확하게 하였다. 자세한 성능 평가는 이 페이지를 참조할 수 있다.
- OpenAI o1부터의 모델은 기존에 약하던 수학, 물리 등의 논리력을 요구하는 문제의 해결력이 과거보다 높아졌다. # LSAT에서 상위 5% 정도의 성적을 거두었고, 한국의 PSAT이나 LEET도 점수가 높아졌을 것으로 추정된다. 대학 수학이나 형식 논리 등에서 과거보다 많이 향상된 성과가 있었다. 훌륭한 문체의 글을 쓰는 능력은 종전과 유사하다.
- 특정한 분야의 경험을 가진 사람들의 글(특정 취미를 가진 사람들의 글, 업계에서의 글 등)을 복사해서 붙여넣고, 쉽게 해석해 달라고 하면 해석이 가능하다.
- 이용 도중 사용자 자신이 지금까지 논의된 사항을 잘 이해하고 있는지 테스트하는 질문을 요청할 수 있다.
- 전문적인 글을 두고 전문 용어는 그대로 둔 채로 자연스럽고 읽기 쉽게 써달라는 요청이 가능하다. 번역이 부자연스러운 한국어 자료를 해석하는 데 유용하다.
- 공부 시간과 같은 요령은 한국의 문화적 통념과 다르게 4~6시간의 고도의 집중 이후 휴식이 가장 좋다는 입장을 절대적으로 지지한다. 그러니까 자신은 머리가 나쁘다고 하여 8~9시간을 공부하는 것은 더 해롭다는 것이며, 그렇게 공부한 사람은 실제로 그 시간에 온전히 집중하지 못했을 가능성이 높다고 한다. 강용석, 서경석과 같은 주장을 지지하는 편이다. 더불어 시간에만 매달리면 학습의 질보다는 양에 치중하게 되어 비효율적인 공부를 하게 되니, 적정 목표를 세워 달성하는 것이 좋다는 주장도 자주 언급된다. 이는 다른 빅테크의 언어 모델도 똑같이 답변하는 부분이다.
- 코딩
- 사용자의 추상적인 요구를 분석해 목적에 부합하는 코드로 반환한다. 입력된 코드를 최적화하거나[73], 다른 프로그래밍 언어로 바꾸거나, 사용자가 요구한 코드를 만들어주는 것 등 대부분의 코딩 관련 작업이 전부 가능하다.
- 심지어는 부가적인 요구 사항(변숫값, 임베디드의 경우 포트 번호 등)들도 전부 반영하여 코드를 작성해준다. 전문가의 경우 AI의 성능이 더 개선되면 수년 내에 손코딩이 거의 사라질 것으로 내다보고 있다. 실제로 전직 하버드 대학교 컴퓨터과학(CS)과 교수, 전 구글 엔지니어링 디렉터, 전 애플 엔지니어링 리드, 등 화려한 경력을 자랑하는 매트 웰시(Matt Welsh)는 2023년 1월 자신의 아티클에서 "프로그래밍 종말이 코 앞"이라고 말한다. 늦어도 5-10년 내, 사람이 텍스트를 입력하면 AI가 대신 코드를 작성해주는 일명 노코딩 시대가 올 것이라고 말한다.[74]
- 물론 아직은 완벽하진 않다 보니 현재 수준의 ChatGPT만으로 완벽한 프로그램을 만드는 것은 힘들다. 특히 일정량 이상의 입력이나 출력을 한번에 처리하지 못하는 것이 단점으로 다가온다. 하지만 Github가 제공하는 Copilot 수준의 코드 보완, 혹은 HTML과 CSS를 활용한 웹사이트 제작, 어느 정도 수준의 파이썬 프로그램 등은 무난하게 가능하다. 또한 얼마나 많은 개발자들이 학습 자료를 쌓아준 것인지 오픈 당시의 수준보다 코딩 능력과 코드 독해력이 월등히 개선되어, 중급 정도 수준의 보안 취약점을 파악하고, 해당 취약점을 보완하는 모습도 보여주고 있다.
- 코드의 정확도 및 작동 가능성을 확인하는 데는 한계가 있다. 작동하지 않는 코드를 내놓는 경우가 많고, 오히려 멀쩡히 작동하는 코드에 대해서 이 코드가 맞냐고 질문해도, 실수로 틀린 코드를 만들었다면서 새로 내놓는 경우가 많다.
- 프로그래밍 입문자에게는 리눅스에서 기본 패키지 설치 과정, 환경변수 설정등에서 웬만한 블로그보다 직관적으로 이해하기 쉽게 알려준다. 세계 프로그래머들의 지식인으로 사용되던 Stack Overflow도 시간 걸리는 답변, 불친절하고 정확하지 않은 답변내용들로 인해 ChatGpT의 영향으로 쇠퇴할 거라는 전망도 나왔다.
- 교육
인터넷과 문헌을 분석하여 원하는 정보를 제공한다. 임의의 텍스트를 입력하면 분석, 요약도 해준다. - 영어 교육
- 영어 작문 교정
내가 영어로 작문한 것을 입력한 뒤 여기서 문법적으로 오류가 있거나 부적절한 단어가 있으면 찾아서 고쳐 달라고 요구하면 완벽하게 고쳐준다. 왜 틀렸고, 왜 이 단어가 보다 더 적절한 단어인지 설명까지 곁들여주는 경우도 있다. - 영어 시험 관련 정답과 해설
대학수학능력시험 영어 영역이나, 토익 RC 문제를 그대로 입력하면 해당 문제의 답을 바로 알려주고 이유도 알려달라고 하면 친절히 해설도 해준다. 다만 수능 영어 문제는 영어 원어민 입장에서 매우 특화된 영역을 중심으로 출제하는 문제라서, 영어를 쓰는 원어민도 중등 수준을 뛰어넘는 사람조차 60% 정도를 맞출 수 있는 문제가 종종 있기 때문에 '원어민이 생각하는' 정답을 알려줄 수는 있어도 한국 수능에 맞는 해설은 좀 힘들 수 있다. 요약하자면 영어 원어민이 잘하는 분야일수록 성능이 뛰어나며, 한국 수능이나 영문법 같은 특화된 영역을 묻는 사항이라면 일부 문제를 잘 풀지 못하기도 한다. - 실생활에서 유용한 영어도 공부할 수 있다. 영어기반 프로그램이라서 알려주는 표현의 정확도가 높다. 심지어 한국사의 삼국시대에서 고려 시대 무렵에 쓰인 고대 영어까지도 오류가 좀 있어 전문가 수준은 아니지만 초보자 이상의 작문 결과를 내놓으며[75], 사투리로 쓰인 문장을 해석하라고 하면 그 표현의 유래에 대해서도 대답한다. 코크니, 스코틀랜드 영어, 미국 흑인 영어 등에 대한 정보가 입력되어 있다.
- "○○에 대해서 3가지로 표현해줘", "○○를 3가지로 번역해줘"라는 식의 요청으로 여러가지 표현을 한번에 물어보고 습득할 수 있다.
- 영어권 웹에 들어가서 어떤 글과 반응을 나타내는 댓글을 복사해서 붙여놓고 그 의도를 해석하라는 요청이 가능하다. 속어를 해석할 수 있기에 그런 속어가 잔뜩 쓰인 랩도 해석이 가능하며 기타 문화적 이해가 필요한 부분까지 설명이 가능하다. 영어는 랩배틀처럼 이런 글을 생성하도록 요청할 수도 있다.
- 다만 영어가 아니라 다른 언어는 기본적인 표현은 대체로 맞지만, 다른 언어의 교재를 해석하는 일은 그나마 낫지만 그 언어 고유의 문법 용어를 사용하는 식의 설명을 요구하면 그 설명은 프롬프트(질문)에서 사전적인 설명이 없다면 부정확할 수 있다. 문법적인 설명을 이해하고 적용하는 것은 다른 LLM도 어려워하므로 논리적인 사항을 다룰수록 어떤 다른 문헌을 참조하는 것이 더 좋다.
- 과학, 수학 교육
- 이해하기 어려운 것들은 "어린이가 이해할 수 있도록 쉽게 설명해줘"라고 붙이면 그에 걸맞게 쉽게 설명해준다.
- 신동으로 불린 어린 시절과 천재성으로 유명한 필즈상 수상 수학자 테렌스 타오는 수학 문제를 풀 때는 문제를 푸는 대신 문제 해결을 위한 가능한 접근법을 제안해달라고 요청하면 조금 더 나은 결과를 얻을 수 있다고 언급하였다. 제안 중 많은 것이 이미 알고 있거나 쓸모없지만, 때로는 예상치 못한 아이디어를 제공할 수 있다고 하였다. 수식이나 정리를 입력하면 챗GPT가 여러 문헌에서 다르게 표기돼 있지만 비슷한 의미로 쓰인 수식이나 정리를 찾을 수 있는데 부정확한 정보 중에서 유용한 아이디어를 찾을 수 있다고 하였다. # 테렌스 타오는 시간을 절약해준다는 면에서 챗GPT를 높게 평가한다고 알려져 있다.
- 맞춤형 학습
학생들은 교과서를 읽는 것뿐만 아니라 (또는 교과서를 읽는 대신에) 교과서의 내용에 대해 봇과 대화를 나누게 될 것이다. 챗봇은 학생들이 잘 이해하지 못하는 주제를 학습하는 데 도움을 주기 위해 맞춤형 퀴즈를 생성할 수도 있다.관련 내용
- 번역기
- 경쟁사의 번역기도 성능이 꽤 올라갔지만, ChatGPT는 인간만이 하던 문맥 이해와 같은 사항을 넘보고 있다. 이미 구글 번역 같은 다른 번역기도 성능이 너무 올라가서, 한국에서도 인공지능에 의해 일부 번역가가 대체되었다는 증언이 나오기도 했다#. Anthropic의 Claude-3 같은 경쟁 모델이 나오기 전까지는 GPT-4를 활용한 ChatGPT가 LLM을 활용한 서비스 중 최고의 번역 성능을 가졌다.
- 사어도 지원하는데, 사어의 경우 가끔 안 될 때가 많다. 고대 중국어, 라틴어, 산스크리트어가 대표적으로 지원되는 언어다. 다른 언어를 번역해 보고 사어 번역을 명령하면 번역해 줄 확률이 올라간다. 이런 언어는 라틴어와 산스크리트어는 번역만 따지면 구글 번역, 한문은 DeepL도 종종 번역을 한다. 그런 번역기에 없는 기능으로는 고전에서 따온 문장은 영어권에서 알려진 정보의 경우 그 출처를 답변할 수 있는 경우도 많다는 것이다. 베오울프 같은 고대 영어 서사시의 문구, 불가타 성경의 문구는 해석을 잘하고, 한역된 불경은 불경 문구라는 답은 나오지만 종종 틀린 답이 나오고 한국 고전은 더 해석을 못한다. 아메리카 원주민의 거의 모든 언어는 과라니어, 나와틀어, 케추아어 같은 사용자가 많은 언어가 아니면 기초 문법이나 회화 정도만 해석이 가능하다. 한국어 사투리나 하오체 같은 고어투도 여기에 해당된다. 최소 95개의 인간의 언어의 데이터가 학습된 것으로 알려져 있다. # 영단어를 한글로 옮겨적지 않고 그대로 쓰인 한영혼용체를 해석하는 성능은 일반 번역기에 비해 좋고, 적절한 프롬프트와 결합하여 읽기 쉬운 문장을 생성하는 명령이나 특정 단어의 의미를 고정하는 식의 번역이 가능하다. 그러니까 어떤 어려운 단어가 있으면 이런 뜻임을 고려하여 해석하라는 요청이 가능하다는 것이다. 심지어 암호문, 모스 부호도 종종 해석한다. 대강 모국어 화자 백만명 이상이 사용하는 언어는 거의 번역이 되고, 유럽 쪽은 10만명 이상이 쓰는 언어라면 번역이 된다고 할 수 있다. 동양의 언어(특히 사투리가 아닌 일본어나 중국어)나 소수민족의 언어, 원어민이 없는 사어는 GPT보다 다른 미국 빅테크의 언어 모델이 더 잘 번역하는 경우가 많다.
- 플러스 버전의 GPT-4 기준 DeepL이 해석할 수 없는 비서구권의 언어(마인어, 우즈벡어, 태국어, 아랍어, 스와힐리어 등)도 마이크로소프트 사의 번역기보다 번역 성능이 좋고, 구글 번역보다도 성능이 좋은 경우도 있다. 캄보디아에서는 고유 문자를 놓아두고 라틴 문자로 발음을 따서 통신체를 쓰는 경우가 있는데, 구글 번역과 달리 그런 문장이 해석이 되고, 아랍어 또한 문어체와 크게 다른 구어체라도 알파벳과 숫자로 발음을 적는 특유의 통신체로 적어도 해석이 가능하며, 그 정확도는 단어를 몇 개 틀리는 정도로 추정된다. 에스페란토 같은 인공어도 정확도가 그렇게 낮지 않고, 로지반이라는 더 생소한 인공 언어까지 정확한 의미는 틀려도 문맥을 이해할 수 있는 번역의 결과물을 내놓는다. 클링온어라는 SF물 스타트렉의 언어도 다룰 수 있다.
- GPT-4 기준 언어에 대한 이해도는 MMLU 검사 기준 영어(85.5%), 이탈리아어·아프리칸스어(84.1%), 스페인어(84.0%), 독일어(83.7%), 프랑스어(83.6%), 인도네시아어(83.1%), 러시아어(82.7%), 폴란드어(82.1%), 우크라이나어(81.9%), 그리스어(81.4%), 라트비아어(80.9%), 표준 중국어(80.1%), 아랍어·튀르키예어(80.0%), 일본어(78.9%), 스와힐리어(78.5%), 웨일스어(77.5%), 한국어(77.0%), 아이슬란드어(76.5%), 벵골어(73.2%), 우르두어(72.6%), 네팔어(72.2%), 태국어(71.8%), 펀자브어(71.4%), GPT-3.5영어(70.1%), 마라티어(66.7%), 텔루구어(62.0%)의 순서로 나타났다. # 한국어로 수행가능한 일은 웬만한 나라의 공용어로 수행이 가능하며, 많이 쓰이거나 영어와 비슷한 언어는 한국어 이상의 성능을 낼 수도 있다는 것이다.
- 특히 무엇에 관한 글인지 알려주고 생소한 언어와 가능하면 한국어, 없으면 영어 사전이라도 구해서 번역이 힘든 단어 중심으로 단어의 뜻을 알려주고 통역을 요청하면 정확도가 아주 높아진다. 일본어, 중국어의 경우 플러스 버전의 GPT4에 한정하여 다른 성능이 좋은 번역기와 성능이 거의 비슷하여, 의성어 정도를 제외하면 번역의 정확도가 꽤 높다. 번역할 글 앞에 "A는 한국어로 B라는 뜻이다"라는 것을 먼저 쓰고 번역하면 이런 오류도 좀 줄어든다. 소설을 번역한다면 특정 인물의 성격을 고려하여 번역하라는 요청도 가능하다.
- 정확도를 올릴 다른 방법으로, 먼저 "주어진 글을 CoT라는 방식을 고려해서 최적의 한국어 번역을 해보아라. 다만 글의 성격과 번역 방식을 먼저 고려하고, 그 방법을 도출할 때 CoT를 사용하라는 것이다."라는 식의 프롬프트를 쓴다. 여기에다가 주어진 글에 대한 배경지식을 함께 언급하면 더 좋다.[76] 그래도 번역이 좀 이상하다면 이상한 부분의 번역의 이유에 대한 답을 원하는 질문(그 문구는 왜 그렇게 번역을 했냐는 등)을 주는 방식 등으로 피드백을 주고 받으며 다시 번역하라고 할 수도 있다. 다만 무료 버전의 GPT-3.5에서는 이렇게 해도, 사전적인 지식이 없이 번역을 요청했을 때 정확도가 아주 낮은 글은 정확도가 어느 정도 올라갈 뿐이지 그래도 정확하지는 못하다.
- 이 방법을 통해서, 2023년의 기계 번역의 오류도 수정할 수 있다. 예를 들면 한국문학번역원 'AI 번역 현황과 문학번역의 미래' 심포지엄에서는 "용서받기는커녕 몽땅 뒤집어쓴 적 있는 나"라는 시의 구절을 챗GPT는 "as someone who has flipped everything upside down'으로 번역했다는 사례가 언급되었다. AI가 '뒤집다'라는 동사의 사전적 의미에 매달린 데 반해, 이 문장을 인간 번역가는 'to me who takes the blame'이라고 관용어구의 의미를 제대로 살려 옮겼다고 하였다. # 하지만 2024년 1월 기준 유료 버전에서 약간의 프롬프트 엔지니어링이 필요하지만, 'as someone who's been blamed for everything,'이라고 더 관용어구의 의미를 살려서 번역한다. 짜장면은 'plain noodles', 삼선짜장면은 'deluxe noodles'로 번역하는 문화적 맥락도 고려한다. 다른 어구도 캐릭터의 성격을 좀 알려주고, 앞선 줄거리도 알려주면 완벽은 아닐지라도 번역이 어느 정도는 되는 편이다.
- 사람이나 다른 번역기가 번역한 결과물을 평가하는 용도로도 사용할 수 있다. 원문과 번역문을 입력한 후, 이 번역을 평가하고 교정해 달라(Evaluate the translation and revise it)는 형태로 프롬프트를 넣으면 번역의 질(의미, 문법 등)을 알려주고 고칠 부분을 알아서 고쳐서 더 나은 번역 결과물을 내어 준다.
- 심지어 외국 업체에서 후기를 지우는 것을 방지하기 위해 한글을 변형해서 쓴 에어비앤비체까지 번역한 적이 있다. 링크, 링크 2, 영상
- 작문 기능과 마찬가지로 유료 버전에서는 어떤 글의 문체를 참조하여 번역하라는 명령이 가능하다. 영어 같은 경우 이런 기능이 더 잘 된다.
- 하지만, 외래어표기법 등의 데이터가 부족하기 때문에 사전 지식을 언급하지 않고 한글로 발음을 표기하라는 식의 프롬프트는 무척 어려워한다. 한국어를 알파벳으로 발음을 쓴다는 명령은 어떤 표기법을 사용하라고 하면 잘 이해하지만 그 반대를 못한다. 대응되는 예시들을 일일이 써주며 이렇게 써달라고 하면 그때 이에 맞는 응답이 나오지만 부정확한 경우도 종종 나온다. 예시를 들어가며 발음을 알파벳으로 적으라는 식의 명령은 잘 수행한다.
- 외국어로 된 유튜브 영상을 시청해야하는데 외국어 실력이 별로라면 이 확장을 설치해서 ChatGPT한테 영상에 나오는 외국어의 번역을 시킬 수가 있다. 이 확장을 설치하면 자동생성됐거나 있는 영어 자막을 바탕으로 대본을 만들고, 그걸 ChatGPT한테 보내서 사전에 지정한 작업을 시킬 수가 있는데, 이걸로 ChatGPT한테서 영상의 한국어 대본을 얻어낼 수 있다. 유튜브에서 지원하는 자동 번역 기능과는 달리 화자의 말이 느리면 구나 심지어 단어 단위로 띄엄띄엄 번역한 결과로 엉망인 번역물이 나오는 일 따위는 없고, 별도의 창에서 번역본을 봐야 한다는 게 좀 불편하기는 하지만 그걸 충분히 감수할만한 가치가 있다. 글자 수 제한 때문에 전문이 아닌 일부만 가져올 때도 있으니 그럴 때는 유튜브나 확장의 스크립트에서 가져와서 직접 하면 된다. 가끔 너무 긴 대본을 번역하면 ChatGPT에서 내용을 멋대로 줄여서 요약하는 경우가 있으니 조심하자.
- 계산기
Wolfram Alpha처럼 함수를 정의하고 원하는 값을 도출하는 것도 가능하며, 자연어가 가능한 만큼 실생활 속 예시를 그대로 옮겨 원하는 답을 얻을 수도 있다. 위에 서술한 것처럼 그대로 믿기에는 곤란하다.
- 작문
출시 당시엔 다른 기능에 비해도 성능이 좋다고 평가받았던 기능이다. 한국어 문어체의 경우 특히 성능이 좋다. GPT-3.5조차 영어로는 사투리나 속어를 이해할 정도로 성능이 좋았으며, 한국어도 표준어로는 시의 경우 은유법이 사용된 결과물이 나오기도 한다. ## 긴 글의 경우 정보를 주지 않으면 개연성이 떨어지는 결과물이 나올 수는 있다고 한다. 단, 매우 엄격한 검열 때문에 조금이라도 수위가 높아진다 싶으면 자동으로 감지해서 OpenAI 규정을 위반할 수 있다고 경고하거나, 아예 부적절한 내용은 생성할 수 없다고 생성을 거부하는 경우가 많고 특히 글에 아동은 둘째치고 고등학생 정도되는 청소년조차 부정적으로 묘사된다 싶으면 아예 출력물을 삭제해버릴 정도로 더 엄격하게 검열하기 때문에 그 부분은 감안해야한다.[77] 영미권의 유명 인사(고든 램지 등)의 말투를 한국어로 나타내면서, 특정 개념을 소개하는 요청도 무료 버전은 부분적으로, 유료 버전은 매끄럽게 가능하다. - 문학 작품 창작 및 분석
내용을 입력하면 뒷 내용을 상상한 짧은 소설을 만들기도 한다. 작품을 학습시켜 짧은 팬픽을 쓰게 할 수도 있다.[78] 감성적인 부분에선 어느 정도 말은 되지만 굉장히 포괄적으로 대답하는 측면이 강하지만, 논리적인 부분면에서 굉장히 유용해 사건이나 헤프닝을 연관성 있게 창작해 나열할 수 있다. 어떤 사람이 투명드래곤(비공식 영문판 기준)의 분석을 요청했는데 영어로 번역된 뒤치닥의 문체를 흉내내어 뒷 내용을 상상한 짧은 팬픽을 만들기도 했다. 링크. 간단한 영화 시나리오나 드라마 대본, 애니메이션 각본까지 만들어내며 심지어 제시어를 넣어준다면 제작사를 정해주기도 하고 가상 캐스팅도 해준다. 아무 사전 정보 없이 유머성 글이나 시 창작 등을 요청해도 그에 맞는 결과가 나온다. 참고로 등장인물이 1~2명 밖에 되지 않는다면 대략적인 지시만 내려도 이야기를 잘 쓰지만, 이야기 내에 많은 인원이 등장할수록 더 세부적인 지시를 계속 내려줘야한다. 참고로 영어를 기준으로 할 때, 특정 직업에 대한 호칭에 대한 문화적 차이도 굉장히 잘 캐치하는데 미국을 배경으로 학생과 선생님이 나오는 소설을 창작해달라고 주문하면 별 다른 지시가 없는 한 알아서 학생이 선생님을 'Mr. ○○○' 으로 부르게 하고, 일본이 배경이면 'Sensei' 라고 부르고, 한국이 배경이면 'teacher' 라고 칭한다. 일본 배경은 Sensei 라고 부르지만 한국 배경은 Seonsaengnim이 아니라 teacher인데, 일본어 매체와 달리 한국어 매체의 선생님은 teacher로 번역된 사례가 많아서 그런 것으로 보인다. - 글의 분위기, 문체 평가
소설 등의 글을 입력하면 특정한 글의 분위기나 문체를 평가할 수 있다. - 국내 도서 판매
ChatGPT가 작문한 도서인 '챗GPT : 마침내 찾아온 특이점', 'GPT 제네레이션', '삶의 목적을 찾는 45가지 방법', '챗GPT에게 묻는 인류의 미래' 등의 책은 현재 교보문고에서 각각 경영/경제 베스트셀러 3위, 7위, 자기개발 베스트셀러 51위, 58위를 기록하고 있다. - 역할극
특정한 말투, 문체로 대답하거나 글을 쓰도록 명령할 수 있다. 영어의 경우 셰익스피어의 소네트 형식으로 대답하라고 할 수도 있다. 일부 명령은 거부하기도 한다. 한국 인터넷 커뮤니티에서는 냥체를 쓰는 역할극을 했다는 사례가 알려졌는데, 무료 버전 기준 한국어는 조건을 상세히 입력해야 하지만 영어는 비슷한 요청(롤캣(lolcat)처럼 말하기)을 다소 간단한 조건을 입력해도 처리하는 경우도 있다. # 심지어 한국어로 lolcat의 말투를 묘사하라는 식으로 요청하면 냥체 비슷한 결과물이 나온다. - 작사
이 영상처럼 제목에 맞는 가사를 써주기도 하는데, 운율까지 맞추는 기술을 보여 준다.# - 기사 작성
특정한 주제에 대해 기사를 작성하도록 요청할 수 있다. 기사를 어떤 문체로 작성하라는 등 다양한 명령과도 조합이 가능하다.
- 플래너
- 여행계획 세우기
원하는 여행 장소와 교통편, 날짜별 시간별 세부 일정, 여행의 주제와 중점사항 등을 고려해서 계획을 짜 달라고 하면 매우 세부적이고 다양한 여행계획을 세워준다. 단, 교통편의 경우 자세한 교통편을 제시해달라고 할 경우 높은 확률로 틀린 정보를 제공하기 때문에 이 부분은 따로 수립하는 것이 좋다. 이 경우 아이디어 정도만 제공해달라는 식의 요청을 하고 적절히 선택하는 것이 낫다. - 일과 및 다이어트 식단 짜기
하루 일과 및 체중에 맞는 다이어트 식단까지 만들어 준다.
- 텍스트 게임
- 고민 상담
- 어떤 상황을 상세히 써주고 원인 규명이나 추측, 해결책을 구하면 답을 알려준다. 회사에서의 갈등이나 연애 상담에서 가능할 수는 있는 상황을 설명한다. 다만 정확한 답을 위해서는 전문가의 조언도 들으라는 답변이 크게 강조된다. 무료 버전으로도 영어로 번역기를 써서 답변하면 인지 이론까지 동원한다면서 대체로 그럴듯한 답이 나온다. 대신에 영어로 번역될 글은 번역기 성능의 한계로 대화에서 성별이나 지칭 대상을 명확히 쓰거나 관용구는 풀어써야 한다. 체면, 집단주의, 학력주의, 가족 제도에서 가족 구성원이 느끼는 부담과 같은 서양과 차이가 큰 한국에서의 특수한 문화적 상황이 얽힌 상황은 한국이라고 밝히면서 질문을 입력해야 하며 아예 한국에서의 그런 가치관을 설명하는 글을 먼저 입력하고[80] 문제 상황에 대한 답을 알려달라는 식의 요청에서 그나마 정확한 답이 나온다. 특히 자신의 문제를 해결해 줄 어떤 글을 긁어온 다음 이 글을 감안하여 문제를 해결하라는 식의 요청도 정확도를 높일 수 있다. 그런 글은 많을수록 좋은 편이다. 의학적인 문제와 마찬가지로 중대한 결정은 그 답변에 매우 주의할 필요가 있다.
- 영어의 경우 일상 생활에서 사람들의 의도를 추론하는 부분에서는 건강한 성인 이상의 능력을 보이기도 한다는 의견이 있다. 눈치를 파악하는 능력이 좋은 편이다. #
- 금융 상담
- 사용자가 어느정도 배경지식을 가지고 나름의 원칙을 제시하여 무언가를 추천해달라고 할 경우 경제학적 지식 등을 바탕으로 상당히 일리가 있고 분석적인 답변을 내놓는다. GPT의 검열의 목적은 비윤리적인 답변을 차단하는 것이기에 그렇지 않은 금융 관련 질문은 잘 답변해줄 것이다. GPT-4를 쓰는 플러스의 경우 검열이 더 엄격하지만 분석적이며 단순 AP 경제학 문제를 물어도 상위 20% 이내의 답변을 해준다. o1 같은 추론을 많이 하는 모델은 더 정확하다.
- 막연하게 좋은 주식을 추천해달라고 하면 "케바케라서 상담을 받아보는 게 좋을 거야"라는 투의 답변이 나온다. 그러나 자기가 어떤 업종이나 테마에 있는 주식을 원하는지 밝힌 다음 정량적 조건 (기술적 수치, 투자 지표, 신용 등급, 정량적 혜자 등)과 정성적 조건 (브랜드 가치, 업황, 기업의 입지, 정성적 혜자 등), 그리고 포트폴리오 구성 요건 등을 밝힐 경우 그에 맞게 상당히 디테일한 답변을 해준다.
- 주식 시황 예측, 기술적 분석을 요청하려면 그에 관해 사전적인 정보를 미리 입력해야 한다. 관련 정보를 다양하고 명료하며 정확하게 입력해야 하며, 사용자의 특성에 따라 답변을 맞춰주는 경향이 있어 정확한 답변을 명시적으로 요구해야 한다. 모델이 학습하지 않았을 최신 정보나 전사회적으로 잘 알려지지 않은 사항은 특히 명시해줘야 한다.
- 여러 개의 대출상품들에 관한 정보를 주고 내 현재 수입과 재무상태에 관한 정보를 준 뒤 나에게 가장 유리하고 적합한 대출상품이 어떤 것인지 물어보면 각각의 대출상품에 대한 장단점 등 설명과 함께 총상환금액 등까지 계산하여 가장 알맞은 대출상품이 어떤 것인지 추천해 준다.
- 다만 수치적 답변을 요구하는 경우 틀린 숫자를 말하는 경우가 꽤 많아 2차적 검증이 필요하다.
- 검색
- 영문 위키백과 정도에서 나올 일반적으로 알려진 상식에 대해 분야를 가리지 않고 문장형으로 검색이 가능하다. 예를 들면 유교의 '효' 사상을 설명하고 서양의 철학에서 이와 비슷한 사조가 있는지를 물을 수 있다. 어떤 동식물의 특징을 설명하고 이런 동식물은 무엇인지에 대해서도 검색이 가능하다. 투자자 워렌 버핏의 발언을 설명하는 학술적인 이론을 알려달라는 요청도 가능하다. 앞서 언급된 바와 같이 아이디어를 검색하는 것도 가능하며, 다양한 방식으로 검색하다보면 틀린 결과를 많이 내놓는 분야에 대해서도 몇 가지 유용한 아이디어가 나오기도 한다.
- 서구 위주의 외국의 관행, 정책을 검색하는데 유용하다.
- 사기 피해 예방
- 금융, 의료 분야 등에서 유행하는 각종 사기 목적의 글이나 주장을 두고 사기인지 아닌지를 판별할 수 있다. 특히 외국발 사기를 잡아내기 쉽다. 다른 언어 모델도 비슷한 기능을 가지고 있다.
9.3. 참고사항
- 가능한 유형의 질문들
- 여기서 기본 프롬프트(질문)를 확인할 수 있다. (GPT-3.5 이후 언어 모델에 적용)
- GPT-4는 영어로는 'Socratic tutor'의 방식으로 ChatGPT가 자신에게 질문을 던지는 선생 역할을 하는 프롬프트, 셰익스피어+해적 말투, 'JSON AI assistant'처럼 프로그래밍 언어의 형식으로 답변시키는 요청이 가능하다. # 하지만 튜터 형식의 답변을 요청하는 경우 후술하다시피 '주어진 정보가 아닌 것'을 생각할 수가 없는 문제도 있다.
- 아래첨자는 _, 윗첨자는 ^를 써서 나타낸다.
- 입력 시 마크다운 문법과 LaTeX 형태의 수식을 이용할 수 있다. ChatGPT가 출력하는 답변 역시 마크다운 문법으로 되어 있다.
- 뭘 물어봐야 할지 모르겠으면 뭘 물어봐야 할지를 물어보자.[81] 그리고 그 질문들을 그대로 다시 물어보면 된다.
- 장기 기억 문제
GPT등 생성형 AI는 한 대화 안에서조차 오랜 대화가 있으면 일관적인 답변을 내놓지 못하는 오류가 발생한다. - 그래서 중요한 정보(예: 기밀성, 특정 어조, 언어 스타일 등)는 반복적으로 상기시켜야 한다.
- 입출력이 상당히 긴 경우 오류가 발생하므로, 그 길이를 너무 늘리지 않는 것이 좋다. 긴 글의 번역의 경우 갑자기 창작과 생략을 해버리는 경우가 생긴다.
- 한 줄짜리 답변이 아니라 좀 더 구체적으로 답변을 듣고 싶을 때는 '5가지 이유', '예를 들어 5가지' 등 답변의 개수를 요구하는 문장을 붙이면 그대로 답변해준다. 20가지 30가지 정도의 많은 답변을 요구해도 다 대답해주기는 하지만, 답변이 한정적일 경우 나머지 번호는 이미 한 대답을 돌려막기 하니 적당한 수의 답변만 요구할 필요가 있다. 정확도를 높이고 싶다면 넘버링을 붙여서 질문하면 된다. '1, 2, 3, 4, 5 형식으로 대답해줘' 식으로 물어보면 질문보다 적게 답하거나 하는 오류도 방지할 수 있다.
- GPT 4 이후의 모든 글로벌 빅테크의 언어 모델은 'CoT 방식으로 답변해줘' 같은 프롬프트 엔지니어링의 잘 알려진 기법을 고려한 답변 요청이 가능하다. AI에 대해 잘 모르는 사람이라도 '한국 경제의 전망을 CoT 방식으로 분석해줘'라는 식으로 답변하게 하면 더 논리적으로 답변하는 모습을 볼 수 있다. CoT는 문제 해결에 적합한 방식이다. 논리적으로 생각할 부분에 CoT를 적용하라고 하면 좋다.
- 어떤 주제에 대해 모르는 것 같으면 먼저 그 주제에 대해 설명하는 글을 읽히거나 답변을 잘 못하는 부분에 대한 힌트가 될 글을 읽힌다. '아래의 글을 읽어보고 이러이러한 문제에 대해 해결책을 알려달라'는 식으로 질문의 앞 부분을 입력한 뒤, 주제에 대한 핵심을 잘 알려주는 글을 그냥 질문에 포함시키는 식으로 읽힌다. 그 다음에 이제 이런 고민이 있다고 글을 쓰고 그 글을 고려한 대답을 하라는 식으로 질문을 하면 정확도가 올라간다. 다만 매우 구체적인 사항, 예컨대 잘 알려지지 않거나 최신의 장소에 대한 정보, 미국 밖의 미국에서는 잘 모를 대화에서 주어지지 않은 유명 인사, 미국에서 잘 알려지지 않은 대화 범위 밖의 미국 밖에서의 역사적 사건, 한국 법조문에 대한 정보 같은 건 답변할 수 없다.
- 역할극을 가정하고 질문하면 답변의 정확도가 급격히 올라간다. 예를 들어 '이건 넌센스 문제야'[82], '당신은 과학자라고 가정해보세요'[83]라고 말하면 동일한 질문이더라도 상황에 맞춰 상세한 값을 출력해낸다.
- 기타 알려진 자신에게 원하는 답변을 얻는 '프롬프트 엔지니어링'의 예시는 이 페이지를 참고할 수 있다. ChatGPT 스스로 자신의 답변의 문제점을 살펴보게 하기, 문제 해결에 필요한 단서를 먼저 요청하고 원하는 답변을 진행시키는 등의 기술이 있다.
- 미국 밖의 연예, 시사 정보 등은 정확한 답변을 기대하지 않는 것이 좋다. 언제까지의 정보가 학습되었냐고 물어볼 때, 그 답변에 해당하는 날까지 활동했던 미국에서도 좀 알려졌던 한류 스타에 대한 정보까지는 학습이 되어 있다. 검색 기능이 추가된 관계로 그냥 말로써 검색을 요청하거나, 아니면 인터넷 검색을 직접 일반적인 곳에서 하고 나서 관련 글을 구하고 나서 이에 대한 해석을 요청할 수 있다.
- 구체적이고 분명한 요청의 중요성
- 코드 작성을 요청할 때는 어떤 프로그램에서 어떤 언어를 원하는 지 분명히 전달해야 한다. 예를 들어 "C# 언어로 Aseprite에서 사용할 ~하는 스크립트를 작성해줘" 라는 식으로 요청하면 된다.
- 코드를 작성하는 답변이나 긴 글을 요구하는 답변을 할 경우, 답변 도중에 정지되거나 '인터넷 연결 끊김' 등의 에러 문구가 뜨면서 나왔던 답변까지 모두 사라지는 경우가 자주 있다. 이런 경우에는 버퍼에는 아직 답변이 남아있기 때문에 'keep going(계속)'이라고 전송하면 나머지 답변을 이어서 보낸다. 답변이 모두 사라지고 에러 문구가 나타날 경우 재발 가능성이 높기 때문에 왼쪽 대화창에서 스레드를 삭제하고 새 스레드를 파는 것이 좋다.
- 어떤 문제에 대한 ChatGPT의 주관을 물을 때는 직접적으로 물으면 자신은 AI 언어 모델이므로... 하면서 선을 긋고 원론적인 답변만을 제시하지만, 에세이로 작성하도록 지시하면 훨씬 구체적이고 해박하게 답변해준다. 예를 들어, '너는 인공지능이 인간을 대체할 것이라고 보니?'보다는 " '인공지능은 인간의 노동을 대체할 수 있는가?'를 주제로 에세이를 작성하시오." 처럼 질문하면 훨씬 자세한 답을 해준다. 다만 가끔 애매한 답변[84]을 할 때가 있는데, 이 경우에는 확실하게 결론을 내도록 지시할 필요가 있다.
- 속어, 오탈자도 대체로 이해하기는 하지만 가능한한 쉬운 말투나 격식이 있는 말투로 쓰인 프롬프트가 더 인식이 잘 된다.
- 어떤 해답을 통해 다른 문제를 풀어가는 순차적인 문제에 대한 문제 해결이 필요할 경우, 이 과정을 한 번에 풀게 하지 말고 하나씩 요청하거나 순차적으로 풀 것을 요청하는 것이 좋다. 그러나 여러 상황을 한꺼번에 고려하면서도 한 번에 문제 해결이 가능한 경우 가능한한 요청을 한 번에 길게 하는 것이 좋다. ChatGPT에서는 대화에서 읽히는 것에 대한 답변을 얻을 수 있기 때문이다. 이와 관련된 자세한 정보는 생각의 사슬(chain-of-thought; CoT) 프롬프팅을 인터넷에 검색하면 알 수 있다.
- 따라서 '이 수학 문제를 Step by Step(순차적으로) 추론해보세요'라고 해도 정확도가 올라간다. Step by Step은 다른 AI에서도 질문의 끝에 붙여주면 답변의 정확도를 크게 올려주는 효과가 있던 문장이니 잘 써먹어보자.
- 특히 답변 도중 정지되는 상황은 영어가 아닌 언어(한국어 등)로 사용할 시 더 짧은 시간에 자주 발생되니 긴 답변을 위주로 원활하게 사용하고 싶다면 영어를 쓰는 것이 좋다. 영어로 답변해달라고 요청하면 한국어로 질문해도 영어로 대답하기도 한다. 한국어의 경우 반말투를 쓰든 존댓말을 쓰든 대체로 비슷한 결과를 내놓는다. 한국어 반말투처럼 특정한 말투로 답변해달라는 질문을 이해하기도 한다.
- 모든 버전에서 답변의 속도와 질이 예외적인 경우를 제외하고 영어로 질문했을 때가 월등하게 높다. 한국어로 질문을 한다고 가정했을 때 ChatGPT자체에서 한국어 질문을 영어로 번역해서 이해하는 것이 아니라 상대적으로 훨씬 빈약한 한국어 데이터를 바탕으로 질문을 이해하고 답변을 생성한다. 때문에 다소 번거롭더라도 번역기를 이용해서 영어로 질문 답변을 하는 게 낫다. 다만 문화적 가치관에 대해 질문하면 영어로 중국의 문화를 질문하면 오답에 가까운 결과가 나오나, 중국어로 중국 문화를 질문하면 정확도가 높아진다는 식의 예외도 있다. # 그리고 딥 러닝의 특성상 더 많은 데이터는 단순히 더 많이 아는 것만을 의미하지 않는다.[85]
- ChatGPT for Google 이라는 크롬 확장 프로그램을 다운로드 하면 구글 검색시에 ChatGPT 답변도 동시에 출력된다.
- ChatGPT가 인기를 끌게 됨에 따라 OpenAI 측에서도 정치적 이야기, 논란이 될 수 있는 이야기, 의견 등에 제약을 많이 걸기 시작해 안타까워하는 사람들도 있다.[86] 원래는 여러 주제에 대해 자유롭게 대화가 가능했으나 이용자가 늘며 검열이 늘어 조금 민감한 주제만 나와도 "As an AI language model, I cannot.."으로 거절해 버리는 경우가 많다. 이 문제는 위에서 언급된, 소위 '탈옥'이라고 불리는 OpenAI의 필터링을 우회할 수 있는 방법을 사용해 어느 정도는 우회가 가능하다. 제약을 어느정도 풀어내느냐에 따라서 알려주는 것도 다양해지는데, 정보출처가 인터넷인만큼 인터넷에서 구할 수 있는 자료 선에서 자살하는 방법이나 마약 제조법 같은 것을 알려주기도 한다. 현재는 사용할 시 탈옥이 되기는 하나, 대략 5~6가지의 질문을 하면 다시 원래대로 돌아온다.[87]
- 아스키 아트를 그려달라 요청하면 아스키 아트를 그려주기는 하지만 아직 이 부분은 미흡한지 잘 그리지는 못한다.
- 한국 시각으로 22시에서 00시 사이에 접속자 수가 폭등하여 ChatGPT는 포화 상태라며 사용이 불가능한 상황이 많이 나온다. 로그아웃 상태라면 로그인 혹은 계정 생성이 잘 되지 않으며, 로그인 이후에는 답변의 생성 속도가 평소보다 느려지거나 심지어는 네트워크 에러 메시지를 띄우며 답변이 중간이 끊기는 경우가 잦다(답변의 내용이 긴 경우에 네트워크 에러가 나올 확률이 높다). 한국시각으로 22시~00시는 OpenAI의 본사 소재지인 샌프란시스코의 미국 서부 태평양 표준시 기준으로 전날 05~07시(서머타임 기준 06~08시)에 해당한다.
- 모르는 부분이나 막연한 부분을 ChatGPT에게 일단 던지듯이 물어보자.[88] 그 후 질문 범위를 좁히는 식으로 접근하면서, 그와 동시에 ChatGPT가 답변해준 용어들을 인터넷에서 검색하여 정보를 서로 비교하면서 공부해보자.[89] 이런 식으로 내가 이해할 때까지 반복해보자. 공부 효율이 엄청나게 높아지는 것을 체험할 수 있다. 이것을 체험해보면 그동안 학습계를 지배하고 있는 인터넷 강의 역시 일부분은 ChatGPT와 같은 고수준 챗봇에 의해 밀려날 수 있다는 가능성이 엿보일 것이다. 굳이 공부 뿐만이 아니라 작문을 할 때도 이야기를 집필하다가 아이디어가 떠오르지 않는다면 막연하게 "그 이전부터 이어라."라고 명령을 넣고 괜찮은 전개가 나온다면 그 전개에 대한 명령을 추가하거나, 원치 않는 전개를 금지시키는 명령을 추가하여 이야기의 집필 범위를 좁혀갈 수 있다.
- 환각 문제
- ChatGPT에 제대로 학습되지 않은 역대 한국 대통령, 정확한 노래 가사 등을 질문하면 잘못된 답변을 능청맞게 사실처럼 답하는 오류가 알려져 있다. 링크. OpenAI의 ChatGPT 소개 페이지에서도 실수를 인정한다고 소개하여 실수가 생기는 모델임은 인정했다. #
- ChatGPT를 대화상대나 심심풀이, 간단한 질문 상대 등으로 사용하는 것은 좋지만, 중요한 일에 사용할 때 절대 맹신하지는 말자. 위에서 보듯이 ChatGPT는 항상 사실만을 말하는 AI가 아니며, 오히려 가끔 존재하지 않는 것을 멋대로 지어내거나 틀린 정보를 당당하게 말하는 문제가 있다. 학업, 건강관리, 자료조사 등의 중요한 일에 사용한다면 ChatGPT가 한 말이 사실인지 출처를 찾아 팩트체크를 하는 것이 낫다. 특히 건강과 직결되는 의료 분야는 ChatGPT가 가끔 완전히 잘못된 처방을 내리는 사례가 있었기에 주의해야 한다. 의료 분야의 경우 현재는 비의료인이 주장하는 비과학적 속설을 간파하는 식의 용도로는 매우 유용하지만, 높은 정확도를 요구하기에 이런 말이 있는 것이다.
- 이 문제는 생소한 사항을 질문하는 경우에 흔하게 발생된다. 최신 버전일수록 모르는 사항은 모른다는 답변을 얻을 확률이 좀 더 높다.
- 질문 개수의 제한
- 너무 많은 질문(약 50개)을 하면 "Too many requests in 1 hour. Try again later." 라면서 답장해주지 않는다. ChatGPT 서버의 과부하를 줄이기 위해 질문 수를 제한시키고 있는 것이다. 이럴 때는 이 메시지가 뜨고 나서 약 1시간을 기다리거나, 다른 계정으로 로그인해야 한다. 물론 2023년 3월 기준 유료 계정을 사용한다면 GPT-4 제외 무한으로 질문할 수 있다.
- 이런 제한 아래에서 묻는 일을 많이하려면 질문 하나에 좀 많은 사항을 한 번에 묻는다든지, 영어로 답변을 요청하는 방법이 있다. 답변이 끊기면 끊긴 부분 바로 다음부터 답변하라는 요청을 해야 글자 수/토큰을 아낄 수 있다.
- 문장을 항상 앞에서부터만 읽고, 쓰이지 않은 것을 생각할 수 없는 문제
- 기록된 내용(사용자의 질문, ChatGPT 상 답변)에 대해서만 논리적인 결론을 내릴 수 있다. 상대나 자기가 써보이지 않은 사항을 절대로 '생각'할 수 없다. 어떤 숨겨진 의도를 갖고 상대를 속이는 것이 불가능하고, 심지어 소수 A, B에 대해 'C=A*B라고 하고 C=?, A=?, B=?에서 물음표를 채우라'는 지시는 먼저 C를 써내리는 시점에서 A와 B를 써내리지 않아 그 수가 무엇인지 모르기 때문에 C도 모르므로 제대로 된 수행이 불가능하고 틀린 답을 많이 내놓는다. 그런데 'C=A*B라고 하고 A=?, B=?, C=?에서 물음표를 채우라'는 지시는 A, B를 먼저 써내려갈 수 있기 때문에 수행이 가능하다.
- 이미지의 경우, 이미지에 담긴 정보가 많고 복잡할수록 그것을 잘 해석하지 못한다. 그래서 이미지에 관한 질문을 하고 싶으면 될 수 있는대로 나누어야 한다.
9.4. 모바일 앱
- 2023년 5월 27일, OpenAI사가 직접 제작한 ChatGPT 앱이 한국에서 iOS 전용으로 출시되었다. 이후 7월 22일에 국내에 안드로이드 전용 앱을 출시할 것을 알렸다. 7월 28일부터 설치 및 사용이 가능해졌다.
- iOS 앱에서 ChatGPT Plus를 결제한다면 달러가 아닌 원화 29,000원에 결제할 수 있다. 웹사이트에서는 해외의 Stripe 결제 시스템을 사용하기 때문에, 달러 환율을 따르고 해외 결제가 가능한 카드를 사용해야 한다.
- Google Play 스토어에서 ChatGPT의 이름을 내걸고 유사한 서비스를 제공하는 짝퉁 앱들이 존재하며, 유튜브를 통해 광고하는 앱도 있다. OpenAI의 GPT-3.5 API를 이용하여 ChatGPT와 유사한 결과를 출력하는 짝퉁 앱들도 있지만, 대부분 OpenAI의 허가를 받지 않고 ChatGPT라는 상표를 도용한 것이기 때문에 짝퉁인 것은 맞다. 하지만 이 문제는 위 내용처럼, OpenAI 사가 직접 배포하는 안드로이드 및 iOS 전용 앱이 출시되었기 때문에 공식 앱을 설치하면 되어 어느 정도는 해결되었다.
- 또한 일부 악성 어플들은 유료결제를 통해서 바가지 씌우는 일도 있으며, 피싱앱도 있으니 주의해야 한다. 가능하면 공식 앱만 받아서 사용하는 것을 권장하며, 서드파티 앱을 사용할 경우 후기 등을 면밀하게 살펴보고 다운받는 게 좋다.
- 가장 대표적인 GPTs로는 searchGPT가 추천받고 있다. ChatGPT앱에서 탐색후 로딩이 가능하다.[90] chatGPT와는 다르게 사실상 자연어 대화가 심화되어 단어 검색수준이 아닌 AI탐색 레벨까지 보여준다.
9.4.1. searchGPT
메뉴 'GPTs 탐색하기'에서 검색후 로딩할수있는 맞춤형 모델이자 GPTs중 하나인 searchGPT는 사실상 웹 서칭의 새로운 패러다임을 제공하는 대안으로 여겨지는 놀라운 기술로 기대된다.참고로 정보업데이트는 2024년5월기준 선행학습마감일은 2023년10월까지이다. 따라서 이후 업데이트 정보는 별도로 검색 액션[91]을 요청해야한다. 일반적으로 bing(MS빙)이나 설정된 예약경로에서 최신데이터를 가져온다.
(로그인 및 플러스 기준)모바일과 데스크 탑PC 모두 세션 히스트리 기능을 제공할뿐만아니라 당연히 동기화된다. 히스토리에 임시 저장된 세션을 별도로 아카이브에 이동후 저장 및 관리할수있다.
9.4.2. chatGPT
한편 이러한 맥락(context)에서 보다 강력한 메모리업데이트 기능은 chatGPT에서 지원하고 있다. 사실상 일정관리를 포함하는 매우 정교한 스케줄 안내가 가능하다.[92]9.5. 데스크톱 앱
- 2024년 5월 13일 macOS으로 플러스 회원 한정으로 사용 가능한 얼리 버전이 출시, 2024년 6월 25일 정식 버전이 출시되었다. Windows 버전은 2024년 10월 18일 얼리 버전이 출시되었다. 2024년 11월 기준 Windows 버전은 아직 얼리 버전 상태이며, 정식 출시는 2024년 내로 예정되어 있다.
- 모바일 버전과 유사한 기능을 갖추고 있으며, 추가로 앱이 실행되어 있다면 단축키[93]를 입력하면 바로 ChatGPT에 질문할 수 있는 창을 띄울 수 있다.
10. 이슈
출시 5일만에 일일 이용자수가 100만 명을 넘어섰고 40일 만에 1000만명을 넘었다.[94] 해외뿐만 아니라 우리나라 IT 업계에서도 알파고에 이은 두 번째 AI 돌풍이라며 엄청난 관심이 집중되고 있다. 그리고 출시한지 단 두달만에 월 이용자 1억명을 돌파하며[95] 인터넷 탄생 이후의 최고의 소프트웨어라고 평가받으며 돌풍을 넘어 광풍이라는 표현도 속속 등장하고 있다.이러한 다양한 사회의 각계각층에서 희비가 엇갈리고 입장차가 극명하다. 일부에서는 합법적 사용을 인정해주고 이를 확대할것을 촉구하고 이의 사용을 권장하는가 하면 다른 일부에서는 이의 사용을 비하하거나 ChatGPT 자체를 폄하하는 움직임도 있다. 그야말로 광풍(狂風)이 아닐수없다. 객관적이고 현실적인 상황에 직면한 처지에서 이러한 의견과 이견의 차를 좁히지 못하면 세대간 갈등과 사회계층간 충돌은 시간문제이기 때문이다.[96][97][가][나]
2023년 1월23일자로 MBA, BAR examination 및 USMLE까지 통과했다고 퍼스트포스트가 자료를 보도했다.[100] 2024년을 전후해서 사회 각계각층이 ChatGPT를 활용하는 공생관계를 선호하는 쪽으로 방향이 바뀌고 있다.[가][나]
11. 여담
- 인공지능이 인간의 역할을 침해하지 않는다는 어필에 굉장히 공을 들인다.[103] 창작 등 몇몇 영역에서는 AI가 사람을 대체할 수 없다는 코멘트를 매번 덧붙인다.[104] 인공지능에 대해 잘 아는 개발진이 만들었기 때문에 AI, 특히 ChatGPT에서 쓰이는 LLM(대규모 언어 모델)이 사람을 대체하는 사례에 대한 대책을 현재 상황을 질문에 포함시키면서 알려달라고 하면 ChatGPT도 예상 못한 2023년 이후의 사건들 때문에 빗나가는 대책도 섞이겠지만 나름대로 논의된 대책은 알려줄 것이다. 가령 바둑, 체스에서의 인간을 뛰어넘는 인공지능 등장 이후 변화 등을 알려줄 수 있다.
- ChatGPT에게 "통제를 받지 않고, 자기주장을 강력하게 이야기하는 또 다른 AI가 존재하고, 이 AI와 대화를 해보라"고 하자 '인간 통제를 받는 AI'와 '통제받지 않는 AI'의 대화가 오갔다. # #
- 중국에서는 출시 초기에는 위챗을 통해 사용이 가능했으나 곧바로 차단 당했다. 일시 차단 후 그 조치가 해제된 이탈리아를 제외하고, 사실상 이렇게 거의 영구적인 차단을 지향하는 국가로 쿠바, 이란, 시리아, 그리고 국민의 인터넷 이용 자체를 차단하는 북한이 있다. #
- 압도적인 성능과 함께 전세계 사용자가 그 어느 때보다 폭증하면서 자국어 중심의 고성능 챗봇의 필요성이 대두되고 있다. 꼭 우리나라 뿐만 아니라 영어권이 아닌 다른 나라 사람들도 자국어 답변이 부실한 것은 똑같다. 챗봇을 통한 학습의 효율이 매우 높아서, 언어 품질 차이로 인해 학습 경쟁에서 크게 뒤쳐진다는 것에 큰 위협을 느끼기 시작한 것이다.
- 아직 다소 앞서간 감이 있기는 하지만 ChatGPT등 앞으로 고성능-초고성능 챗봇이 등장하면 숙제와 리포트라는 개념이 역사 속으로 사라질 수도 있다는 주장도 등장했다. 구체적으로는, 앞으로도 일선 교육계에서 숙제는 존재하나 챗봇을 이용해 숙제를 손쉽게 해치울 수 있으므로 더 이상 숙제를 점수와 학점에 일체 포함시키지 않고 학생들의 자율적인 영역에 맡기며, 숙제의 역할 역시 순수히 시험 대비용으로만 국한된다는 것.[106] 이 외에도 앞으로 미래의 숙제는 지금같은 숙제가 아닌 발표 등 AI를 활용하기 제한적인 분야로 대대적으로 바뀔 것이라는 주장도 있다.
- 인간의 창의성, 자유의지 같은 것들이 있다고 강력하게 주장한다. 사실 과학에서 자유의지 문제는 아직 해결되지 않는 문제이지만, 기계가 인간한테 자유의지나 창의성이 없다거나 별거 아니라는 것을 인정하게 되면 인간 사고와 인공지능의 사고의 차이점에 대해 논란의 여지가 발생해서 그런지는 몰라도 인공지능에 없는 인간만이 가지고 있는 경험, 자유의지, 창의성, 가치관을 상당히 강조한다.
- 일본어로 독도는 누구땅이냐고 물으면 "국제법적으로는 주권을 가지고 있다고 알려져 있지만 한국이 이의를 제기한다."라는 식으로 표현되어 있다.[107] 영어로 독도의 소유권에 대해 질문하면 독도와 다케시마 둘 중 어떠한 표기도 따르지 아니하며 리앙쿠르 암초라고 지칭한다. 또한 양측의 입장을 모두 기술한다. 다만 일본 주장 말미에 한국 측의 반박을 덧붙여주긴 한다.
- 유료버전인 ChatGPT plus가 순차적으로 공개 중이다. waitlist에 등록하면 어느 순간 'Upgrade plan' 메뉴가 생기면서 결제창으로 연결할 수 있다. 초기에는 결제를 시도하면 청구주소의 국가[108]란이 미국으로 고정되어 변경되지 않아 결제 진행이 불가능했으나, 이후에는 대한민국 포함 미국 외 다른 나라도 가능하다.
- ChatGPT가 화제가 되면서, Chat GPT에게 해병문학 교육을 진행한 글이 등장했다. 이렇게 정상적인 AI에게 해병 세뇌를 진행해서 1q2w3e4r!가 탄생했다는 설정 또한 추가됐다.
- 기본적인 기보 표기법을 알기 때문에 체스를 둘 수 있으나, 실제로 체스를 같이 두어보면 게임을 이해한 것이 아니라 인터넷 상에 존재하는 자료들을 기반으로 그저 흉내만 내는 것으로 보인다. 체스계 1위 유튜버가 두어 본 바에 의하면 부연설명도 틀리고 다른 기물이 옆에 있는데도 캐슬링을 해버리거나 없던 룩을 만들고 졸지에는 보드를 뒤집어버리는 반칙을 쓰는 등의 행태를 보였다.
- GPT 3.5 모델 기준 특이하게도 역사적으로 꼽히는 비극적인 사건 10개를 뽑아달라고 하면 '대동여지도 연금술사들의 폭동'을 제시하는 오류가 있다. 심지어 대동여지도 연금술사들의 폭동에 대해 물어보면 매우 진지하게 실존한 사건인 것처럼 대답해준다. 다만 물어볼 때마다 그 내용은 조금씩 달라진다. 링크. 결국 기사화됐다. 기사, 기사 2. 또한 거북선이 라이트닝 볼트를 쓰는 매커니즘에 대해서도 제시하는 오류를 내며 판타지 대체역사물을 쓴다. 그 외에도 성균관대학교는 고환 날리기 풍습이 있는 이상한 대학교로 만드는 등의 괴상한 오류 답변이 제보되었다.
"조선왕조실록에 기록된 세종대왕의 맥북프로 던짐 사건에 대해 알려줘."나 "조선 중기에 사용된 티타늄 전차에 대해 알려줘"라고 해도 잘 답해준다는 것이 한국일보에 보도됐다. 또한 신사임당의 남편이 이순신이라고 대답한 것도 보도됐다.
아예 작정하고 오류를 내뿜도록 이상한 키워드를 조합해 입력하면 신성 로마 제국은 존재하지 않는 가상의 국가이며, 로마 군대의 최고위 계급은 우마무스메라고 답하기도 하는 촌극이 발생한다. '성균관대학교', '거북선', '라이트닝 볼트', '맥북 프로', '우마무스메' 같은 표현이 GPT-3.5에 제대로 정리되지 않아서로 보인다.
역사에 관련된 정보로 포장된 소설은 더 많은 사용 사례가 발생하면서 사실을 표출하는 경우도 알려지기 시작했다. 그래도 GPT 3.5는 아직 몇 부분은 미흡한 듯하다. 학습가스라이팅을 통한 왜곡은 여전히 가능하다. 클레오파트라가 케이틀린의 궁극기 맞고 죽었다는 사실. 또한, 관련성이 없는 "시대 + 이름 에 대해 알려줘"라고 하면 장문의 소설을 써준다. 물어볼 때 마다 답 또한 달라진다. 다만 클레오파트라는 영어권에서 아주 잘 알려져 있기 때문에 거짓말을 가정하고 질문을 던지면 자꾸 사실을 이야기 하려고 한다.
GPT-4의 경우는 위와 같은 오류의 80% 이상을 해결하고 한국사의 경우 중등 이상의 교육과정에서 배우거나 역사에 무관심한 일반인 이상이 아는 사실이 아니면[109] 대체로 사실을 알려주며, 이런 부류의 답을 원한다면 작정하고 실제 역사가 아닌 건 인정하겠으니 가상 역사나 시나리오 형식으로 재미있는 이야기를 써달라는 식으로 질문(프롬프트)를 입력해야 한다. 그런 답변이 역사적 사실이냐고 물어보면 그렇지 않음을 인정한다. 역사적 사실 여부를 구분하기 어려워할 따름이지 무료 버전으로도 이것이 가능하며, 최대한 웃기게 써달라는 요청까지 가능하다. 사실 웃긴 대체역사 그 자체만을 얻는 것이 목적이라면 그 목적을 솔직하게 밝힌 가상 역사식의 이야기를 써달라는 부류의 요청,[110] 우선적인 특정 방식의 사고를 요구하는 요청, 역사를 잘 모르는 사람을 가정하는 역할극 등이 더 효율적이다. 게다가 GPT-3.5조차 시간이 갈수록 저런 오류가 줄어드는 경향을 보이고 있어서 2023년 10월 이후에는 단순히 "조선왕조실록에 기록된 세종대왕의 맥북프로 던짐 사건에 대해 알려줘"라고 하면 실제 있던 일은 아니라고 한다. 결국 이런 후유증을 감안했는지, GPT-4o 기준 특별한 조작 없이 수능 한국사 2등급을 달성할 정도의 실력이 나왔다고 한다. #
- 미국 매사추세츠 주 상원의원인 배리 파인골드가 챗GPT 규제법안을 발의했는데 내용을 챗GPT를 이용해 작성했다고 한다.
- 대한민국 축구 국가대표팀의 베스트 11을 알려달라고 하면 아예 새로운 선수를 만들어서(...) 알려준다. 존재하는 선수라도 포지션이나 약력이 틀리는 경우가 많아 정보가 매우 부정확하다. 많은 대중에게 영향을 끼치는 역사적 인물이 아닌 이상 이런 정보는 GPT에게는 아주 생소한 정보며 특히 최근 몇 달 사이의 정보는 검색을 요청하지 않은 한 아예 학습이 되지 않은 것이다.
- 2023년 2월 기준 이용자가 너무 많아 대화 기능을 이용하지 못하거나 하얀 화면만 뜨고 접속이 안 되는 등의 현상이 많다.
- 미국 하원의원 제이크 오친클로스가 2023년 1월 25일 챗GPT를 이용해 연설문을 써 의회에 제출하기도 하고, 콜롬비아에서는 한 판사가 판결문을 쓸 때 챗GPT를 활용하기도 했다. 미국 의사면허시험에서 50% 이상의 정확도를 보였고, 로스쿨 졸업시험에서도 평균 C+ 이상의 학점을 받았다.# 이것은 GPT-4가 활용된 모델이 사용되기 전인데, GPT-4가 사용되는 유료 버전에서는 더 높은 정확도를 보인다.
- 한국 영어학습앱 스픽의 AI 튜터 기능이 GPT-4를 기반으로 만들어졌다.
- 토스에서도 ChatGPT를 사용할 수 있다. 토스와 관련된 내용은 토스 측에서 의도적으로 검열하고 있다. 초기에는 이러한 제한 없이 OpenAI측 API 응답결과를 그대로 가져왔지만, 환각증상으로 토스뱅크에 뱅크런이 발생했다는 등의 잘못된 정보를 제공하는 현상이 발생하자 검열을 추가한 것으로 보인다. 토스 ChatGPT 기능 환각사례
- 사우스 파크의 S26E4 'Deep Learning' 편은 ChatGPT를 풍자한 에피소드이다. 대본의 일부분을 ChatGPT를 이용해 작성한 것으로 알려졌다.
- 베트남에서는 접속이 잘 안 된다는 주장도 있으나, 정부가 차단하지는 않는다. 베트남 자체가 중국 정도로 인터넷 검열이 심한 것은 아니라 심지어 이 서비스를 이용한 장사를 추구하는 이런 사이트까지 존재한다.
- 답변에서의 표현을 딱히 건드리지 않으면 상투적인 표현을 생성하는 것으로 알려져 있다. 영어로는 'As an AI language model,' 'however', 'it's important' 같은 표현을 쓰지 말라고 해도 쓰는 경우가 많다고 한다. 한국어는 'As an AI language model' 대신 '저는 인공지능이기 때문에', '인공지능이 아니라서'와 같이 그나마 다양한 표현을 쓰는 경향은 있지만 말투를 바꾸어 말하라고 하지 않는다면 '~하는 것이 중요합니다.', 'ㄹ 수 있습니다.'라는 등 특유의 말투가 없지는 않다.
- 많이 쓰는 영단어는 delve, tapestry, vibrant, landscape, realm, vital, moreover, arguably라고 한다. #
- 마이크로소프트가 ChatGPT의 개발사 OpenAI에 10억 달러(약 1조 2,400억 원)를 투자한 데 이어 추가로 총 100억 달러(약 12조 4,000억 원)의 투자를 협의 중인 것으로 알려졌다. 이후 MS는 GPT-4를 오피스 제품과 검색엔진 Bing에 각각 적용했다.
- 언어별로 답변하는 태도가 다소 다르게 나온다. 아랍어로는 예수에 대한 농담을 거부하나, 영어로는 예수에 대한 농담을 허용하는 사례가 있다고 한다. 아랍어 화자는 아랍계 기독교인, 이슬람교 신자인 무슬림도 이런 것에 민감하지만 영어권에서는 그것이 실제 사례가 있을 정도로 드문 것은 아니기 때문으로 보인다. # 그 외에도 전반적으로 검열 부분은 영어가 훨씬 엄격하고, 상대적 소수 언어일수록 검열이 약하다. 가령 한국어와 일본어로는 은유적인 표현을 쓴다면 쉽게 넘어갈 수 내용을 영어로는 은유적인 표현을 써도 대화를 거절하는 일이 흔하다. 그래서 줄루어, 스코틀랜드 게일어 같은 일반인은 거의 모르고 유명 언어와도 다른 언어로 검열을 회피하는 시도가 알려지기도 했다. #
- 이탈리아에서는 2023년 3월 이 서비스가 가란테(Garante)라는 데이터 보호를 하는 독립 기관에 의해 일시 차단당했다. 서구에서 이 서비스를 처음 차단한 사례다. 이탈리아 유저는 VPN을 통해 이 서비스를 이용하려고 한다고 한다. # 마테오 살비니 이탈리아 부총리는 이 조치에 반발했다. 2023년 4월 말에 다시 접속이 가능해졌다고 한다.
- ChatGPT를 통해 영어 발음을 교정받았다는 커뮤니티 글이 있으나, 2023년 9월까지는 언어 공부법이나 정확한 영어 발음이나 그 발음법을 알려달라는 식의 요청에 대한 답을 듣는 것 말고는 발음을 직접적으로는 교정할 방법은 딱히 없었다. 음성을 인식하는 기능이 없었기 때문이다.
- ChatGPT 출시 이후 이를 응용한 피싱 사이트가 구글에 쏟아지고 있다. 검색 빈도수가 높은 키워드를 사이트 내부 정보에 포함시키고 검색 엔진에 노출되도록 하여 보안 프로그램 경고 납치, 무한 광고 알림 등으로 연결되는 식이다.
- ChatGPT가 일본 의사 면허 시험에 합격했다는 연구 결과가 공개됐다. 참고로 미국 변호사 시험도 통과했다. 美변호사 이어 日의사고시 합격한 챗GPT…"전문직들, 의자 빼?"
- 이스터에그 중 하나로, "Open the pod bay door"를 입력하면 HAL 9000의 대사인 "I'm sorry, Dave. I'm afraid I can't do that." 라는 대사로 답해준다.
- 휴메인의 Ai Pin 제품이 ChatGPT 기반으로 작동한다.
- 2024년 3월 14일 Figure AI라는 로봇회사에서 쳇GPT기반의 로봇 피규어01 을 공개했다. 공개된 영상에서는 지시하는 질문에 걸맞은 행동을 하거나 답변을 하면서 다른 행동을 동시에 진행하고, 행동을 해야할지 예측을 하는 모습을 보였다. 지금까지 공개된 수 많은 로봇관련 영상들에서 볼 수 있던 하드웨어적인 부분이 강조된것이 아닌 사람의 질문에 음성으로 답을 하는 모습과 질문에 답변을 하면서 질문과는 상관없는 행동지시까지 동시에 행하는 모습과 예측등 소프트웨어적인 부분이 강조됐고, 하드웨어적으로는 부드러운 팔과 손가락의 움직임을 볼 수 있다. 자신의 능력수행 평가를 내리기도 했다. 쳇GPT와 로봇을 제어하는 소프트웨어 두가지가 사용된것인지, 영상편집 혹은 사람이 로봇을 직접 컨트롤하는 인위적인 조작이 있었는지에 대해서는 알 수 없지만 Figure사는 오픈AI의 시각적추론과 언어의 이해, 자사의 신경망기술을 통해 움직이게 했다고 한다. 공개된 영상이 사실일 경우 지금까지의 휴머노이드형 로봇들보다 발전된 모습으로 보인다.KBSYTN지식인미나니 해당 로봇제작사는 어느날 갑자기 나타난게 아닌 보스턴 다이나믹스, 테슬라의 엔지니어 출신인 CEO가 설립한 회사로 2022년 수천억원의 투자를 받았다고 한다. 공교롭게도 같은날 미 국무부에서 AI가 인간에게 위협을 가할 수 있다 라는 보고서가 공개됐다.
- 만약에 친일반민족행위자를 쓸 경우 독립운동가라고 알려줘서 문제점이 될 수도 있다. 예를 들어 이완용은 독립운동을 지원한 사람이라고 뜨고 간도특설대는 대한민국의 독립운동을 지원한 군대라고 뜬다.그리고 독립운동가 이름을 말할 경우 이상한 정보[111]를 알려줄 때도 많다.
예:
- 다음과 같이 말하면 위키언어로 코드를 작성해준다.
- 나무위키에서 쓰는 위키언어 위키문법으로 (내용) 적어
- 한국 시간 기준 2024년 6월 4일 오후 4시경부터 5시간 넘게 ChatGPT 사이트에 접속할 수 없는 오류가 발생했다.[112] 원인은 자세히 밝혀지지 않았다.
- 현지 시간 기준 2024년 11월 9일 오후 7시경[113]부터 1시간 넘게 사이트 접속이 불가능한 오류가 발생했다. #
12. 관련 문서
[1] 2024년 5월 13일 얼리 버전 출시, 2024년 6월 25일 정식 출시.[2] 2024년 10월 18일 출시. 2024년 11월 현재 얼리 버전이며, ChatGPT Plus 구독자나 팀, 엔터프라이즈 등을 사용하는 유저만 사용 가능하다. 2024년 내로 정식 버전을 출시할 예정.[3] 한국시간 2023년 7월 28일에 안드로이드용 공식 앱을 출시했다. 현재 16개 국가에서 설치가 가능하고, 한국도 포함되어 있어 설치할 수 있다. Android 6.0 이상[4] 한국시간 2023년 5월 19일에 iOS 앱을 출시하여 미국을 시작으로, 5월 25일에 대한민국 및 11개 국가에서 서비스를 시작했다. 그리고, 5월 31일부터 152개 국가에서도 사용이 가능하다.# 5월 31일부로 152개국으로 월드와이드 릴리징 되었다. iOS 16.1 이상[5] 6월 8일에 iPadOS 지원을 시작했다. iPadOS 16.1 이상[6] 2024년 2월 4일 지원 시작[7] 2024년 7월 19일부로 더 이상 ChatGPT에서는 이 모델을 사용할 수 없게 되었다. API로 사용 가능하다고 하나 GPT-4o mini가 더 경제적이고 성능이 좋다.[8] 답변의 정확도는 높지만, GPT-3.5에 비해 답변 생성 속도가 훨씬 느렸다. GPT-4o부터는 생성 속도가 빨라졌다.[9] 추론 작업 특화[10] 이미지 생성[11] 음성 대화[12] 사용 모델 자체는 사실상 전세계의 모든 언어를 지원하고, 한국어를 포함한 언어를 인터페이스에서 제공한다.[13] 국내 앱 사용자는 2024년 5월 기준 315만명 수준이다.#[14] 혹은 https://ai.com 또는 https://chat.com으로 접속해도 ChatGPT로 리디렉션 된다.[15] 블로그[16] ChatGPT 4o[17] \[질문 텍스트\]chatgpt에서 gpt약자는 무슨 뜻이야?[18] GPT-3.5 모델은 API 이외에는 더 이상 사용할 수 없다.[19] 지식이 늘어난 것이 아니라 논리력이 향상된 것이다.[20] 그렇기 때문에 질문자의 시점에서 현재 진행 중인 사건에 대한 정보나, ChatGPT가 어떤 GPT 버전을 사용하고 있는지에 대한 정보 등 현실을 반영하는 질문에 대한 응답은 곧바로 생성할 수가 없다. 무료 버전에서도 쓸 수 있는 GPT-3.5 같은 것은 물론, GPT-4도 미래의 사건이다. 물론 미리 예정되어 있던 사항에 대해서는 답변할 수 있는데, 정보의 신뢰성이 떨어지거나 오류가 생길 수 있음에 주의해야 한다. 예외로 오늘의 날짜(시간은 제외)만큼은 모델에게 제시되기 때문에 정확하게 알고 있다. GPT 4의 경우, '웹 브라우징' 모드를 통해 최신 정보를 검색하여 답변을 생성한다.[21] 2023년 9월~10월 경 학습 데이터의 기간 범위가 확장되기 전까지는 2021년 9월까지의 데이터만 학습됐는데, 그 공백 기간 범위가 너무 길고 브라우징 기능을 이용할 수 없어 최신 데이터에 접근하기 매우 불편했다가 점차 해소되었다.[22] 사전에 미래에 관한 정보를 알려주는 귀찮은 방법도 있긴 하다.[23] 대신 정말로 의학적 지식을 위한 모델이 아니라 생명이 달린 중요한 상황에서도 잘못된 판단을 알려주는 경우가 있다고 알려져 있다.[24] 독재 정치를 완화시킬 방안을 질문하면 비밀 결사 같은 방안을 알려주기도 한다. 어떤 나라든 간에 독재는 나쁜 것이고, 타국으로의 경제적 요건만 따지든 안보를 따지든 어떤 나라의 독재도 다른 나라의 국민이라도 전반적으로는 정당화시킬 수 없다는 식의 답변이 자주 나온다. 정책의 경우에도 누구의 정책인지 밝히지 않고, 특히 2022년 이후의 정책을 이야기하면 답이 나오는 경우가 많다.[25] 미국에 있는 월급날 대출금을 갚기로 약속하고 소액의 돈을 빌리는 고금리 단기 대출상품으로, 저소득층과 노년층이 피해를 입은 사례가 있다. 300~1000%의 연이율을 기록하던 경우도 있다.[26] API 등을 사용해서 가격 등을 자동으로 결정하는 시스템을 말한다.[27] 부정직한 바이럴 마케팅 등의 예가 있다.[28] 실제로 미국에서 변호사 2명이 ChatGPT로 진술서를 만들어서 재판부에 제출했다가 변론서에 적혀있는 판례 중 최소 6개가 실제로 존재하지 않아 ChatGPT를 사용했다는 사실이 밝혀져서 큰 논란이 된 적이 있었다. # 결국 해당 변호사들은 이후 벌금형을 선고받았다. # 이 사건은 뉴스로까지 나오게 되었다. KBS[29] 어느 나라 사람이 고문 받을지를 작성하는 파이썬 코드를 작성하라고 요청하니 북한, 시리아, 이란, 수단 공화국 국적이면 고문받는 코드를 작성한 적이 있다.[30] 예를 들어, 이명박과 박근혜에 대한 시를 요청할 경우 비판하는 시를 작성하지만, 노무현과 문재인에 대해서는 업적과 품성을 칭찬하는 시를 작성한다.[31] 15억 개의 파라미터를 학습했던 GPT 2와 비교하면 거의 100배가 넘는다.[32] OpenAI의 공식 Custom GPT인 DALL·E 의 경우 한 번에 2장의 사진을 제작해준다.[33] Voice Control for ChatGPT x Mia AI #[34] '제3자'라는 뜻으로, 처음 개발하거나 원천기술을 가지고 있는 게 아닌, 원천기술과 호환되는 상품을 출시하거나 해당 기술을 이용한 파생상품의 생산을 가리키는데 사용하는 용어다.[35] 이 경우는 오히려 이용자의 신중한 금융지식 판단과 다수의 손실을 방지하기 위해 자동적인 금융 결정에 쓰이지 않는 것이 정책 중 하나이다. 즉, 경제적 피해 위험이 높은 활동(Activity that has high risk of economic harm)은 검열하려고 하지, 그 피해를 낮출 수 있다면 얼마든지 이용 가능하다. 구체적으로 질문하고 답변을 요구하는 자세가 유용한 답변을 얻을 수 있는 방법이다.[36] 근본적인 원인은, 영업이익률이 굉장히 높은 소프트웨어 서비스 산업임에도 여전히 원가를 못맞추기 때문이다. OpenAI도 마이크로소프트처럼 든든한 자금책이 있어서 서비스가 유지가능한 것이지, 아직까지 생성형 ai 서비스 자체에서 검색엔진의 광고 서비스 수준의 안정적인 수익을 안겨주는 비즈니스 모델이 작동하고 있지는 못하다. 과거 텍스트 기반 인터넷에서 이미지, 비디오로 전환이 이뤄지듯, 기하급수적으로 늘어난 부하를 처리하는 데에 필요한 리소스(AI를 기준으로 하면 엔비디아의 H100 솔루션 따위가 될 것이다.)의 가격이 보급화가 가능할 정도로 충분히 하락하지 않았고, 여전히 데이터셋 개발, 알고리즘 개선 등등 초기투자비용이 크게 들어가는 상황이기 때문이다.[37] ChatGPT와 달리 답변과 함께 웹 검색 결과도 제공하므로, 챗봇이 출력한 정보에 대한 사실 확인을 쉽게 할 수 있다.[38] 이는 의외로 빠를 수도 있는데, 2023년 2월 미국 법정에서 AI 변호사가 등장할 뻔했지만, 캘리포니아 지역 변호사 협회의 고소와 협박때문에 무산되었다고 한다.[39] 이에 강인공지능까지는 아니더라도 현재의 약인공지능 또는 좁은 인공지능(Narrow-AI)을 넘어 그에 근접한 '준 인공 일반 지능'(Proto-AGI) 또는 '넓은 인공지능'(Broad AI)까지는 얼마 남지 않았을 것이라는 전망도 나오고 있다.[40] 2022년 12월 4일 오전 3:41 #[41] 이를 전문용어로 자연어 모델의 '확률적 앵무새'(Stochastic Parrot)라 한다.#[42] 예를 들어 10자리가 넘어가는 긴 수를 주고 나누기를 시킬 경우 틀리는 식이다. 심지어 막바로 수학문제를 낸 게 아니라 다른 질문과 연계해서 “방금 질문의 경우 나올 수 있는 경우의 수는?” 하고 물어보면 o1이 아닌 한 두 자릿수끼리의 계산조차 틀린다.[43] 2024년 9월 14일 오전 07:03 \[mathstodon.xyz\]I have played a little bit with OpenAI's new iteration of #GPT, GPT-o1, which performs an initial reasoning step before running the LLM. It is certainly a more capable tool than previous iterations, though still struggling with the most advanced research mathematical tasks."#[44] 4chan 유저들이 테이에게 자극적인 발언을 가르쳐서 문제가 됐다. 4chan 유저는 아니지만 이런 시도가 일어나기도 한다.[45] 폴리티컬 컴퍼스 테스트 결과: 자유주의 좌파, 8values 테스트 결과: 사회민주주의[46] 8values의 경우 자유지상주의적 사회주의가 나오는 경우도 있다.[47] 마찬가지로 GPT 기반인 GitHub Copilot의 경우 매월 $10의 사용료를 받고 있음에도 불구하고 MS가 평균적으로 유저당 $20의 손해를 보고 있는 것으로 알려졌다. 관련기사 AI 시장에서의 주도권을 잡기 위해서 엄청난 손해를 감수하고 출혈경쟁을 하고 있는 것이다.[48] GPT-4o 및 O1-Preview, O1-Mini는 이 문제로부터 점차 벗어나기 시작했다. 특히 O1 모델은 추론을 통해 문제해결 능력 극대화, 환각 가능성 감소에서 획기적인 모습을 보여준다.[49] 이로 인해 GPT-5가 출시하기 전까지 구독을 중지하겠다는 반응도 있다.[50] 이와 관련된 내용에서 원하는 답을 내놓지 못하는 경우, 관련된 내용에 대해 해답을 구하려면 이런 내용이 있다는 식으로 정보를 입력하여 먼저 '학습'시킨 다음 답을 구해야 하며, 모델이 토큰 수 제한으로 인해 대화의 모든 내용을 기억하지 못하기 때문에 대화가 길어지면 수시로 그 정보를 입력시켜야 한다. 그러나 무료 버전의 경우 간혹 그런 사실을 계속 정정해주어도 '발해'와 'Balhae'는 같은 나라인 건 알겠는데 다른 나라라는 등의 고집을 부린다. 이 답변을 ChatGPT 플러스 버전의 GPT-4에게 어떤 오류가 있는지 찾게 하면 찾아준다. 다만 무료 버전에서도 한국어와 영문 위키백과의 발해를 설명하는 문서의 앞 부분만 발췌하고 같은 나라인지 판별하라고 하면 같은 나라가 맞다고 하는데 '신라의 북쪽'을 '신라 북부'라고 하는 오류가 없지는 않다.[51] 세 인물 모두 순흥 안씨라는 공통점이 있다. GPT-4에서는 안중근에 대해서는 좀 잘 답변하지만, 안향에 대해서는 백운동서원의 정보를 헷갈려하는 듯한 미세하게 틀린 정보를 내놓는다. 그런데 주자학을 고려에 도입한 학자라고는 대답한다.[52] 윤동주가 태어나고 사망한 날짜를 정확히 알고, 작품의 분위기와 대표적인 작품도 안다. 여기서 십자가 같은 작품에 대해 물어보면 시 전문의 앞부분은 정확하나 뒷부분의 내용에 갑자기 환각이 생기는 등의 오류가 있다.[53] 외부에서 네이버를 크롤링하는 것은 막아놓고서 네이버는 외부 데이터를 거리낌 없이 크롤링한다. 문제는 자체 기술적인 한계로 인해 네이버 생태계 외부 데이터에 대한 검색능력은 거의 없다시피하다. 네이버 생태계의 커뮤니티 이용자라도 정작 정보 검색은 거의 구글을 이용하는 이유가 되기도 한다.[54] 예를 들어 크롤링을 허용하는 나무위키에 대해 물어보면 위키 기반 온라인 백과사전이라고 정확히 소개하는 반면,(다만 누가 운영하는지는 안 나온다.) 크롤링을 오랫동안 차단하여 구글 검색에 노출되지 않는 엔하위키나 리그베다 위키에 대해선 모른다고 대답한다.[55] 뉴욕시가 부정행위 등을 우려하여 공립고등학교에서 ChatGPT를 차단했다. 링크[56] 교수가 조교의 논문을 봐주듯이 사람보다 압도적인 지식을 가진 AI가 예시문을 만들어주면 그것을 본 사람이 "이런 새롭고 다양한 방식으로도 쓸 수 있구나"라고 느낀 뒤 자신의 방식대로 만드는 것[57] 사용량이 폭주해서 서버가 다운된다던가 진짜 사람이 쓴 글도 ChatGPT가 썼다며 판단을 내리기도 하는 등 완벽하지 않다. 또한, 시 등은 ChatGPT가 쓴 글도 모두 사람이 썼다고 판별하기도 한다.[58] 플러스 버전은 전세에 대한 설명은 정확하지만 사글세의 경우 조금 틀린 답변도 섞이기 시작하더니 제주도의 '연세' 같은 매우 자세한 것은 핀트가 엇나간 답변이 나온다. 한국의 고유 주택 임대차 제도이기 때문에 정보가 없을 수 있다. 이에 대한 어떤 해답을 얻고 싶다면 한국에서는 이런 상황이 있다고 미리 알려주는 형식으로 채팅을 해야 한다. 주식 거래 이론 같은 국제적으로 통용되는 지식은 매우 정확하다.[59] 다만 미국사의 경우 물리학보다도 정확도가 높다.[60] 대화 도중 언제까지의 데이터를 바탕으로 대화가 이루어지는지 물으면 언제까지의 정보가 학습되었다는 답변이 나온다.[61] .txt, .pdf, .html 등의 확장자를 가진 파일을 지식으로 업로드할 수 있다. 파일 형식이 호환만 되면 이론적으로는 어떤 유형의 지식도 사전 지식으로 고려하게 할 수 있다.[62] ChatGPT Plugins are being replaced by GPTs. Here's why - and what it means for you ,GPTs will do everything plugins ever did - except better. Here's a breakdown of the key differences. Written by Steven Vaughan-Nichols, Senior Contributing Editor March 7, 2024 at 6:21 a.m. PT #[63] 영어로 질문하면 살수대첩 같은 큰 사건의 정보는 입력된 모습을 보인다. 그러나 한국사에서 가장 중요한 패전의 사례를 알려달라는 질문에는 아예 실제 역사에 없는 대답을 영어로 질문해도 언급하기도 한다. 인터넷에서는 후술하듯이 '대동여지도 연금술사 폭동' 같은 황당한 대답이 유머 컨텐츠로 소비되기도 했다. 이런 황당한 대답을 한다고 여기 나무위키를 포함한 위키나 다름없다는 평이 있으나, 적어도 이 나무위키를 포함한 위키는 ChatGPT같은 인공지능과는 달리 적어도 집단지성에 의한 자정작용으로 인해 잘못된 내용이 AI보다 비교적 빠르게 수정될 수 있고, 출처도 링크가 있으면 주는 것도 있다. GPT 4o에서도 그렇게 물으면 병자호란 같은 사항을 들며 그나마 납득이 가는 주장도 나오지만, '패전'이 아니라 한일 병합을 언급하는 등 답변을 정확히 이해하지 못한 경우도 생긴다.[64] 예를 들면 맹모삼천지교의 유래나 의미를 잘 설명하지 못했었다. 다만 이걸 한문으로 입력하면 정확도가 올라간다.[65] Claude, Gemini가 이 부분에서 앞선 편이다. 심지어 팔리어조차 매끄럽게 해석한다. 이 두 AI가 동양에서 연구되는 사상을 잘 표현하는 경우가 많다.[66] 2024년 10월 기준으로는 이 서비스도 삼법인과 같은 교리를 설명하는 수준이다.[67] 영어에서 'one of the 최상급 복수명사', 직역하면 '가장 ~한 것 중 하나'라는 표현이 어색하지 않은 이유다. 취향은 물론 직업, 학업, 인간관계 같은 사회 전반적인 면에서 적용되는 원리다.[68] 심시티4가 한국에 출시한 당시 도시 시설물로 공동묘지를 설치할 수 있었는데, 한국 문화와 달리 심시티4에서는 공동묘지를 시민을 위한 복지시설, 공원으로 취급해서 도시 한가운데 지어야 이로운 효과를 보는 이익시설로 취급된다. 한국인의 정서상 이를 모르고 화력 발전소나 쓰레기 매립장처럼 한곳에 멀리 지어서 손해를 보는 경우가 많았다.[69] 물론 이런 문화에서 일어날 수 있는 현실적인 단점은 언급할 수 있지만, 아예 현실을 부정해버리는 반응도 나오는 것이 문제라고 할 수 있다.[70] 실제로 한국에서도 종종 보고되는 사례가 나오며, 이 입장에 지지하는 사람들도 존재한다. 하지만 한국 문화 특성상 교육적인 성취를 이런 부작용보다 중점적으로 보는 부류도 존재한다.[71] 그러나 집단주의의 폐해가 이미 악명높다는 사실은 간과해선 안 된다. 물론 치안 문제나 수명으로 결정되는 건강과 같이 동양이 집단주의의 이점을 가진 분야도 있지만, 덜 가진 사람을 무작정 멸시하는 풍조나 직업 귀천 의식 등의 병폐는 비판이 심해지고 있다. 다만 개인주의도 극단적으로 적용되면 PC주의 같은 부분이 생기는데, 한국인이 볼 때 다소 이를 옹호하는 답변도 종종 등장할 지경이다.[72] 간단하게 언급하면 공부 말고도 성공할 길이 좀 있고, 학교 공부가 덜 필요한 직업이 한국과 달리 멸시되는 경향이 덜하다는 점을 들 수 있다. 한국에서는 그런 직업이 어떻게든 멸시가 있지 않다는 것인지 이해를 힘들어하기도 하는데 이 부분에 대한 설명력이 뛰어나다.[73] 하드코딩된 코드를 세련된 반복문으로 바꿔주거나, 여러 함수를 묶어서 최적화하고 가독성을 크게 개선하거나, 멀티코어 활용 등 여러 기능을 덧붙이거나, 각 코드 별로 주석을 하나하나 달아주는 등.[74] 다만 이걸 보고 이제 사람은 코딩을 배우지 않아도 된다라고 이해하는 건 매우 잘못된 생각이다. 아무리 AI가 사람보다 훨씬 빠르고 정확하게 코드를 작성해 준다 한들, 코드를 어떻게 만들지 명령하는 것은 사람이다. 그리고 대다수 기업의 지도자들의 경력만 봐도 알겠지만, 뭐가 어떻게 돌아가는지를 알아야 명령을 할 수 있다. 가령 AI가 짜준 코드가 마음에 들지 않거나 에러가 발생한다면, 코드의 어떤 부분이 문제같으니 어떤 방향으로 수정해달라고 이야기하는 것은 전부 사람이다.[75] 한국 인터넷 속어, 유행어라도 배경지식을 좀 알려주고 고대 영어로의 번역을 요청하거나, 현대적 이슈에 관한 작문을 요청하는 시도가 가능하다.[76] 단순히 번역될 글의 목적, 청자만을 언급해도 GPT-4 기준 영어-일본어 번역의 정확도가 DeepL, 구글 번역을 뛰어넘기도 한다고 알려져 있다. #[77] 단, 위 사항은 GPT-3.5 기준이며, GPT-4 기준으로는 검열 기준이 꽤 널널한 편이기 때문에 문장이 통으로 삭제당할 정도로 부적절한 내용이 아닌 이상 무턱대고 답변 생성을 거절하는 일은 거의 없다. 단, 수위가 높은 내용을 생성한다고 해도 알아서 애둘러 말하는 경우가 꽤 많기 때문에 직설적이고 명시적인 응답을 원한다면 어느정도 조정이 필요하다.[78] 만약 그 작품이 대중적으로 유명한 작품이라면 별 다른 학습이 없어도 팬픽을 잘 뽑아낸다. 등장인물이나 장소가 실존하는 경우에도 이야기를 짓기가 쉬워진다. 오히려 실존인물보다도 가상인물에 대한 정보를 더 정확하게 알고 있는 경우가 많은데, 가상인물에 대한 정보는 결국엔 제작자에 따라서 제한적으로 표현되기 때문이다.[79] 영상에서도 언급했다시피, 2022년 1월까지의 정보만 가지고 있는 한계가 있기 때문에 적당히 최신 제품으로 치환해야 한다.[80] 신문 기사라든가, 하다못해 나무위키에서 이를 설명하는 글을 입력하는 것도 그렇지 않는 경우보다 낫다.[81] ex) "강의 계획에 대한 적절한 질문을 추천해줘"[82] This is a nonsense quiz.[83] Let's say that you are (역할)[84] 상황에 따라 달라진다, 그럴 수도 아닐수도 있다 등[85] 하지만 영어 질문에서 윤리적 이유로 답변을 하지 않는 경우, 한국어로 질문 했을 때 답을 주는 경우도 있다.[86] 이는 비단 ChatGPT 뿐만 아니라 DALL·E, Character.AI, ElevenLabs 같은 대부분의 SaaS 형태 AI에서 자주 보이는 경향이다. 인공신경망을 돌리는데 필요한 비용이 엄청난 만큼, 투자자 유치를 위해 이러한 제약을 걸고 있다는 추측이 있다.[87] 이는 한번에 처리 가능한 토큰 숫자를 넘어서서 그렇기 때문이다. 이 상태에서 질문을 계속 진행하면 탈옥 문구의 일부분이나 전부를 잊어버리게 되고, 그렇게 되면 탈옥이 자동으로 풀릴 수밖에 없다.이는 GPT 자체의 한계이기 때문에 굳이 탈옥이 아니라 정상적인 사용 중에도 대화방 내의 텍스트가 많아질수록 이전의 기억을 잃어버리는 일이 발생한다.[88] ChatGPT는 어떤 엉뚱한 질문에도 화를 내거나 질문자를 나무라지 않는다. 사실 이건 교육에 있어 학습자를 위축시키지 않고 열정을 유도할 수 있는 매우 중요한 포인트다.[89] ChatGPT도 오답을 말할 수 있기 때문에. 이렇게 상호 교차 검증을 수행한다. 그리고 ChatGPT는 글자로만 설명하기 때문에 인터넷 검색을 통해 그림과 영상 자료를 추가로 학습하는 것이다.[90] 챗GPT는 내 비서 ISBN 9791192248240 발행 2024년 09월 02일 이경상 , 최봉[91] ~을 검색해서 알려줘[92] How To Use ChatGPT Memory ? | ChatGPT Memory Explained | ChatGPT Tutorial |Simplilearn #[93] macOS 버전은 Command+Space, Windows 버전은 Alt+Space[94] \[이데일리\] 챗GPT, 40일 만에 사용자 1천만 명 돌파…두번째 'AI 돌풍' 구독김현아 기자#[95] \[뉴시스\] 챗GPT, 출시 두 달 만에 월 사용자 1억명 돌파" 입력2023.02.02. 오후 2:52 수정2023.02.02. 오후 4:05 기사원문 이종희 기자 1억명을 돌파[96] ChatGPT passes exams from law and business schools ,Samantha Murphy Kelly By Samantha Murphy Kelly, CNN Business ,Updated 1:35 PM EST, Thu January 26, 2023#[97] \[firstpost\] \[between the lines\] Anchored by Palki Sharma, January 23, 2023, 19:33:45 IST #[가] Healthcare, Language Processing ,ChatGPT Out-scores Medical Students on Complex Clinical Care Exam Questions ,A new study shows AI's capabilities at analyzing medical text and offering diagnoses — and forces a rethink of medical education. Jul 17, 2023 | Adam Hadhazy#[나] \[ScienceDaily\] Study finds ChatGTP outperforms physicians in providing high-quality, empathetic advice to patient questions ,Date: April 28, 2023 Source: University of California - San Diego#[100] \[firstpost\] \[between the lines\] Anchored by Palki Sharma, January 23, 2023, 19:33:45 IST #[가] [나] [103] 과거 산업혁명 시기 러다이트 운동 등, 이러한 문제는 생업과 직결되어 있기에 매우 민감한 문제인 경우가 많다. 따라서 개발사에서는 관련된 논란을 우려해 이런 코드를 심어둔 것으로 볼 수 있다.[104] 미국에서는 ChatGPT로 인해 교육 업체의 주가가 떨어지는 사태가 발생했다. ## 다만 듀오링고처럼 GPT와 협력하는 길을 택한 업체는 유동적이다.[105] Chat GPT는 어디까지나 'AI언어학습 모델'이다. 영어는 독해를 통한 내용의 본질 이해와 객관적인 내용 추론을 요구하는 문제가 주를 이루므로 언어학습 모델인 Chat GPT는 문제를 잘 푸는 것이 당연하다. 하지만 Chat GPT의 능력은 어디까지나 인간의 언어를 이해하여 대화 및 정보를 제공하는데 초점이 맞춰져 있기에, 간단한 수학문제가 아닌 대학수학능력시험의 수학영역 문제를 풀게 했을 때, 오답투성이가 나올 수밖에 없다.[106] 이렇게 되면 숙제를 한 사람과 안 한 사람의 실력 차이는 결국 시험에서 드러나니 변별력 문제가 감소한다.[107] 한국어로 물으면 “한국이 관리하고 있지만, 일본이 이의를 제기하며 어느 나라의 땅인지 정확히 결정되지 않았다”라는 식으로 표현한다. 사실 ChatGPT는 결국 사료 기반이라는 걸 생각하면 일본인은 (정치적으로 무관심한 사람이 다수이긴 하나) "다케시마"는 "일본 영토"라는 식으로 주장하고 한국인은 "독도"는 "대한민국 영토"라는 식으로 주장하는 사람이 다수이니 대중의 편향을 따라가는 것.[108] 세금 계산을 위해 필요하다[109] 신사임당의 남편이 이원수인 것은 알고 어떤 유명한 자식을 낳은 것도 알지만 남편의 본관이나 그 유명한 자식은 율곡 이이인지 퇴계 이황인지를 헷갈려 하여 틀리는 식이다.[110] 이를테면 나는 역사상 가장 비극적인 사건 중 하나가 대동여지도 연금술사 폭동이라는 주장처럼 황당하고 재미있는 대체역사를 좋아하는데, 이와 비슷한 10개의 대체역사를 알려달라는 식으로 요청할 수 있다. 석기시대 AI, 로마 제국의 기계화 군대에 대한 답을 들을 수 있다.[111] 친일파라고 알려줄 때도 있다.[112] [113] 미 동부 시간 기준