애플리케이션 | |
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px)" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-6px -1px -11px" | 개인화 및 소셜 |
뉴스 및 미디어 |
[[Chrome| Chrome]] [[구글 포토| 구글 포토]] [[스냅시드| 스냅시드]] [[유튜브| 유튜브]] [[배경화면(구글)| 배경화면]] [[구글 뉴스| 구글 뉴스]] [[Stadia| [[Google Vids| Google Vids]] |
문서 도구 |
[[구글 드라이브| 구글 드라이브]] [[구글 문서| 구글 문서]] [[구글 스프레드시트| 구글 스프레드시트]] [[구글 프레젠테이션| 구글 프레젠테이션]] [[구글 설문지| 구글 설문지]] |
Google Play |
[[Google Play| Play 스토어]] [[Google Play 게임즈| Play 게임즈]] [[Google TV| Google TV]] [[Google Play 북| Play 북]] --[[Google Play 뮤직| Play 뮤직]]-- |
부가 서비스 |
[[구글 렌즈| 구글 렌즈]] [[구글 번역| 구글 번역]] [[구글 애드센스| 구글 애드센스]] Google Ads [[구글 어스| 구글 어스]] [[구글 지도| 구글 지도]] [[구글 카메라| 구글 카메라]] [[구글 카드보드| 구글 카드보드]] 마이 비즈니스 [[구글 트렌드| 구글 트렌드]] 안드로이드 포 워크 |
기기 종속성 |
[[안드로이드 오토| 안드로이드 오토]] [[Wear OS| Wear OS ]] [[Google Pay| 구글 페이]] [[Google Home| 구글 홈]] [[Gboard| Gboard]] [[구글 파이 와이어리스| 구글 파이 와이어리스]] |
서비스가 종료된 구글 서비스 |
[[구글 행아웃| 구글 행아웃 ]] [[구글 알로| 구글 알로 ]] [[구글+| 구글 플러스 ]] [[Google Currents| Currents ]] [[Stadia| Stadia ]] [[Play 뮤직| Play 뮤직]] |
}}}}}}}}} |
구글 번역 Google Translate | |
<colcolor=#667E8C,#EFEFEF> 용도 | 통역기, 번역기 |
지원 기기 | Android, iOS |
제작사 | 구글 |
[clearfix]
1. 개요
2006년 4월 28일에 Google에서 출시된 무료 기계 번역 서비스로, 현재 세계에서 가장 많이 사용하는 기계 번역 서비스다.2. 명칭
'Google 번역기(Translator)'가 아니라 'Google 번역(Translate)'이 올바른 명칭이다. 약 200억 개의 번역된 단어를 사용하며, 번역된 단어가 없으면 소리가 나는대로 표기하고 있다. 또한 텍스트 뿐만 아니라 웹 페이지 등의 번역도 가능하다.3. 역사
처음 출시되었을 때는 영어, 프랑스어, 스페인어, 중국어 4개 언어만 지원했으나, 2007년 5월부터 한국어도 지원하기 시작했다. Google의 명성에 힘입어 번역기에 관심이 높아지자, Google은 계속해서 새로운 언어를 추가했다. 2012년 11월에는 63개 언어, 2013년 7월에는 71개 언어를 지원했다. 2022년 5월 12일 산스크리트어 같은 고대 언어와 인도 아대륙의 지방 언어, 아메리카 원주민의 유력 언어, 아프리카 일부 지역의 공용어, 필리핀의 일로카노어가 추가되어 133개 언어를 지원하게 됐다.Google 번역이 만들어진 당초 목적중 하나는 한국어를 번역하기 위함이었다. 2004년에 Google 회장인 세르게이 브린이 한국의 팬으로부터 받은 메일을 번역기[1]에 입력하자 마치 수수께끼처럼 「The sliced raw fish shoes it wishes. Google green onion thing![2]」으로 번역됐다고 한다.(회(The sliced raw fish) 신(Shoes) 바랍니다.(It wishes.) 구글(Google) 파(Green onion) 이팅!(Thing!)) 이는 Google이 직접 번역 서비스를 만들게 된 계기 중 하나가 되었다.[3](NYT 기사)[4]
2016년까지 10년 넘게 통계적 기계 번역으로 사용되었는데, 그 기간 중에 초창기에는 야후!에도 사용되었던 SYSTRAN 기반의 번역기를 사용했지만, 2007년 10월부터 독자적인 번역 엔진으로 갈아탔었다. 이렇다 보니 당시 다른 번역기들과 비교해서 높은 정확도였지만, 간단한 문장이 아닌 한 항상 오류가 있을 정도로 완벽함과는 거리가 있어서 사람들이 이상한 번역을 보고 '구글 번역이냐?'고 놀리기도 했다.
그랬던 구글 번역이 2016년 9월 28일부터 AlphaGo에도 쓰인 딥러닝 기술을 적용하기 시작했는데, (#1, #2) 기존 구글 번역의 오류를 58~87% 줄였다고 한다. 영어↔중국어 번역부터 제공한다. 딥러닝 번역으로 번역된 결과물을 구별하는 방법은 PC에서 웹 번역을 할 때 기준으로 번역 결과물에 마우스를 올리면 알 수 있다. 기존 방식으로 번역된 결과물은 예전처럼 단어가 하나하나 대응되면서 번역이 되기 때문에 어떤 단어가 어떤 번역에 대응하는지 알 수 있을 뿐 아니라 단어 단위로 번역 제안이 가능하다. 반면 딥러닝 번역의 결과물은 문장이 한번에 선택된다.
2016년 11월 15일에 드디어 인공신경망 기반 영어↔한국어 번역 서비스가 도입됐으며(#) 번역 품질이 크게 향상됐다. 당장 차이를 매우 확연히 느낄 수 있을 정도이며 상당수의 문장을 완벽에 가깝게 번역한다. 영어↔일본어↔한국어 경유 번역보다 영어↔한국어 직번역이 훨씬 결과물이 좋다. 과거에는 영어를 중심으로 신경망 기계 번역으로 향상됐는데, 지원하는 언어쌍은 영어↔프랑스어, 독일어, 스페인어, 포르투갈어, 중국어, 일본어, 한국어, 터키어(튀르키예어) 간의 8개 쌍이었지만, 최근에는 지원하는 모든 언어끼리 이를 지원한다.
2016년 구글의 신경망 기반 번역에서 'Zero-shot' 번역이 가능함이 밝혀졌다.(#) Zero-shot' 번역이 가능하다는 것은 영어↔한국어, 영어↔일본어를 학습시키고 한국어↔일본어를 학습시키지 않았는데, 한국어↔영어↔일본어 이렇게 중역을 거치는 것이 아니라, 바로 한국어↔일본어로 번역이 가능하다는 의미이다. 신경망 번역은 문장을 백터 좌표로 해석하기 때문에 이게 가능하다. 부연하자면 영어 번역물 데이터만을 학습시켜도 다른 언어간 번역이 가능하다는 것일 뿐, 당연히 다른 언어끼리 직역시킨 데이터가 풍부한 경우의 번역품질이 더 좋다.
그런데 한국어는 맥락을 중시하는 언어라 전체 맥락을 봐야 의미를 똑바로 이해할 수 있는 게 있다. 예를 들어 여성 정치인 박근혜에 대해서 이야기하는 기사일 경우, 한국어에서는 인칭대명사 그를 남녀 구분없이 사용할 수 있으므로 인칭 대명사 그를 쓰는데 영어로는 He라고 번역이 되어서 읽기에 어색하다. 문단을 신경망으로 번역할 수 있다면 더 나은 번역이 될 수 있을 것이다. 사실 전세계의 언어가 마찬가지라 영어의 'set' 같은 단어의 경우 수십 개의 다른 의미를 가지고 있으며, 한국어의 지시대명사처럼 '그'라고 하여 남을 고려하기 보다는 자신의 관점에서 지시대명사를 구분하며, 가까운 일본어라도 한국어와 달리 나이를 뛰어넘어 친소를 드러내는 목적으로 존댓말과 반말을 사용하는 경향이 있어 문맥을 모르면 그 어떤 언어도 번역이 어려울 것이다.
그리고 2016년 12월 23일 Chrome 사이트 번역에도 신경망 번역이 도입됐다. 그런데, 번역된 문장 위에 뜨는 번역 제안하기를 누르면 옛 알고리즘 문장이 나오므로, 신경망 번역으로 번역된 문장에 제안을 하기 위해서는 옛 알고리즘 문장을 더블 클릭하면 신경망 번역된 문장이 뜨므로 그렇게 제안하면 된다.
2017년 10월 경, 한국어 TTS(문자 음성 변환) 기능의 목소리가 바뀌었다. 원래 여성의 목소리였다가 현재 남성의 목소리로 바뀐 것인데, 다른 TTS 서비스가 그렇듯 Google 역시 일반적으로 여성의 목소리를 TTS 음성으로 채택하고 있던 터라, 꽤 예외적인 케이스라고 할 수 있을 것이다. 일본어 TTS의 경우 원래 목소리를 썼었으나, 이후 목소리가 바뀌면서 두 개의 목소리로 나오다가, 현재는 변경된 목소리만 나오고 있다.
2020년 5월부터 소수언어를 번역할 시 의성어 문자열을 '해석하는 현상'이 사라지고 더 정확도가 향상됐다. #
2023년 중순부터 한국어 번역의 정확도가 크게 상승했다. 이전까지 파파고나 DeepL보다 하찮던 퀄리티가 2023년 여름을 기점으로 경쟁이 가능한 수준으로 퀄리티가 높아졌다. 성경 문구는 성경에 쓰이는 특유의 어투로 번역하는 등 문맥 파악의 융통성이 크게 상승되었다.
2023년 11월 1일부터 크롬에서 뜨지 않았지만 11월 24일 확인 결과 '구글 번역기'가 아닌 그냥 '번역기'로도 구글 번역 기능이 나온다.
3.1. 한국에서의 웹사이트 번역 차단
"해당 서비스는 귀하의 지역에서 사용할 수 없습니다." |
2021년 7월 20일 방송통신심의위원회의 국민신문고 민원 내용에 대한 답변 {{{#!folding [ 펼치기 · 접기 ] | <tablealign=center> |
2020년 9월 15일부터 페이지 번역이 대한민국에서 차단됐다.[대체품] Google 측에서 이유를 밝히지 않았으나 방송통신심의위원회[6] 측에 의하면, 구글 번역 URL 서비스를 통한 불법 사이트 차단 우회접속이 가능했고, 이에 관련 내용에 대한 시정을 꾸준히 요구했다. 따라서 구글 측에서는 구글 지도의 위성 레이어 기능 제한처럼, 원천적으로 구글에서 URL 번역을 차단한 것으로 보인다.
방심위에서는 막을 권한이 없다고는 했으나, 이는 2019년 인터넷 검열 사건에서도 나온 주장이었고, 이러한 주장은 책임회피를 한다는 지적을 받아왔다. 당장 방심위는 형식적으로는 민간기관이지만 사실상 민간기관의 탈을 쓴 국가행정기관이라는 지적이 나오고 있으며, 헌법재판소 역시 사실상 국가행정기관으로 본다고 판시하기도 했다.[7]
이를 피하는 방법은 Google 계정의 국적을 한국이 아닌 다른 국가로 변경하거나 VPN을 사용하면 된다. 하지만 몇몇 웹페이지는 레이아웃이 깨지거나 표시가 안될 수 있으니 연덱스나 다른 웹사이트 번역을 쓰는것도 생각해봐야 한다. Chrome에 내장된 사이트 번역 기능은 먼저 해당 사이트에 정상적으로 접속이 되어야 작동하므로 이 조치에서는 예외다. 지금은 위 스크린샷에 오른쪽 상단 태극기가 어째서인지 사라졌다.
===# 언어 목록 #===
2022년 5월 12일 업데이트 기준. 133개 언어를 지원한다.
2024년 6월 27일, 100여개의 언어가 더 늘어났다.
ㄱ
ㄴ
ㄷ
ㄹ
ㅁ
- 마니푸리어(메이테이 마옉 문자)
- 마두라어
- 마라티어
- 마르와리어
- 마셜어
- 마오리어
- 마이틸리어
- 마카사어
- 마케도니아어
- 말라가시어
- 말라얄람어
- 말레이어(아랍 문자)[10]
- 맘어
- 맹크스어
- 메도우 마리어
- 메이테이어(마니푸르어)
- 모리셔스 크리올어
- 몰타어
- 몽골어
- 몽어
- 미낭어
- 미얀마어(버마어)
- 미조어
ㅂ
ㅅ
- 사모아어
- 사미어 (북부)
- 사포텍어
- 산스크리트어
- 산탈어
- 상고어
- 샨어
- 세르비아어
- 세부아노어
- 세소토어
- 세이셸 크리올어
- 세페디어
- 소토어(남부)
- 소말리아어
- 쇼나어
- 수수어
- 순다어
- 스와티어
- 스와힐리어
- 스웨덴어
- 스코틀랜드 게일어
- 스페인어
- 슬로바키아어
- 슬로베니아어
- 시칠리아어
- 신디어
- 실레지아어
- 싱할라어
ㅇ
- 아랍어
- 아르메니아어
- 아바르어
- 아삼어
- 아와디어
- 아이마라어
- 아이슬란드어
- 아이티 크레올어
- 아일랜드어
- 아제르바이잔어
- 아체어
- 아촐리어
- 아파르어
- 아프리칸스어
- 알루르어
- 알바니아어
- 암하라어
- 압하지아어
- 야쿠트어
- 에스토니아어
- 에스페란토어
- 에웨어
- 영어
- 오로모어
- 오리야어
- 오세트어
- 오크어
- 와라이어
- 요루바어
- 우드 무르트어
- 우르두어
- 우즈베크어
- 우크라이나어
- 월로프어
- 웨일즈어
- 위구르어
- 유타텍 마야어
- 은다우어
- 은데벨레어 (남부)
- 응코어
- 이그보어
- 이디시어
- 이반어
- 이탈리아어
- 인도네시아어
- 일로카노어
- 일본어
ㅈ
ㅊ
ㅋ
- 카시어
- 카자흐어
- 카탈로니아어
- 카팜팡안어
- 칸나다어
- 칸누리어
- 케추아어
- 켁치어
- 코르시카어
- 코미어
- 코사어
- 콕보룩어
- 콘칸어
- 콩고어
- 쿠르드어 (소라니) / (쿠르만지)
- 크로아티아어
- 크리오어
- 크림 타타르어
- 크메르어
- 키냐르완다어
- 키르기스어
- 키투바어
ㅌ
ㅍ
- 파슈토어
- 파피아멘토어
- 팡가시난어
- 펀자브어 (구르무키) / (샤무키)
- 페로어
- 페르시아어
- 포르투갈어 (포르투갈) / (브라질)
- 폰어
- 폴란드어
- 풀라니어
- 프랑스어
- 프리울리어
- 프리지아어[11]
- 피지어
- 핀란드어
- 필리핀어
ㅎ
====# 어족별 분류 #====
어족별로 분류하면 다음과 같다.
인도유럽어족
니제르콩고어족
- 만데어파
- 볼타콩고어군
오스트로네시아어족
- 말레이폴리네시아어파
아프리카아시아어족
튀르크어족
- 보편 튀르크어파
드라비다어족
중국티베트어족
우랄어족
오스트로아시아어족
크라다이어족
카르트벨리어족
몽몐어족
- 몽어군
몽골어족
- 중앙몽골어군
한국어족
일본어족
- 일본어파
투피-과라니어족
아이마라어족
케추아어족
고립어
크레올
인공어
3.1.1. TTS 여부
4. 작동 원리
컴퓨터 번역 프로그램을 만든다면 언어학자들이 대거 동원될 것 같지만, Google에 따르면 언어학자는 해당 팀에 단 한 명도 없다고 한다. 국제기구나 기업 등에서 동일한 문서를 A 언어, B 언어, C 언어 등의 여러 언어로 만들어 놓은 것을 검색엔진이 검색하여, 많은 결과를 바탕으로 번역한다고 한다. 이러한 번역 원리를 말뭉치[14] 기반 기계번역(corpus-based machine translation; CBMT)라고 일컬으며, 두 언어 간의 병렬 말뭉치(bilingual parallel corpus)를 기반으로 비교분석하여 번역 결과물을 출력하는 과정을 거친다.[15] 말뭉치를 만드는 원리에 있어서는 통계적 기계번역(statistical machine translation; SMT)에 해당한다.즉, 단어 대 단어, 구절 대 구절의 사용 빈도를 나타내는 모델을 만들어서 어떤 단어 및 구절의 번역으로 가장 많이 나타나는 표현이 확률적으로 정확하다는 것이다. 또한 그렇게 단어 및 구절 층위에서 확률적으로 정확한 표현이 선택되면 그것이 배열되는 순서도 마찬가지로 가장 많이 나타나는 순서가 확률적으로 정확하다고 판단하고 번역물을 출력한다. 그렇기 때문에 팀에 언어학자가 하나도 없어도 된다.
2016년 이전까지 적용되던 이 원리에 따르면, 인터넷에 많은 정보가 번역되어 있는 언어가 가장 번역 품질이 높게 된다.[16] 한국어↔영어 간의 직접 번역보다 한국어↔일본어↔영어 중역이 더 정확한 경우가 많았다. 한국어와 영어간 번역 사례보단 일본어와 영어 간의 번역 사례가 훨씬 많고, 한국어와 일본어간의 번역 사례도 엄청나게 많다는 점 때문이었다. 당시 Google 번역은 알아서 중역을 지원하진 않기 때문에 사용자가 알아서 중역을 해야 했다.(실제 사례) 이에 중역을 이용한 웹서비스도 있었다.(더 나은 번역기)
한국어와 번역 사례가 한국어↔영어보다 적어서 중역을 거치는 외국어, 특히 그 중에서도 인도유럽어족 언어의 경우 영어를 할 수 있다면 영어로 읽는 편이 가장 의미 전달이 정확했다. 2012년에는 아예 영어를 할 수 없다면 영어를 통해서 중역이 필요하라는 조언이 구글에서 나올 정도였다.(Google 기계번역 담당자를 인터뷰한 신문기사)
그러나 2016년 11월부터 영어↔한국어 간의 딥러닝 기반 번역 지원으로 위의 팁은 사실상 쓸모가 없게 됐다. 현재 한국어에서 영어로 번역, 영어에서 한국어로 번역 모두 중역보다는 직역이 훨씬 자연스럽고 정확도가 높다. 모든 언어에서 중역보다 직역이 정확도가 높다.
신경망 번역은 대량의 데이터를 필요로 하는데 이 경우 사람마다 번역하는 방식도 다르고 품질도 제각각이라 좋은 품질을 내려면 구글이 데이터를 균일하게 잘 정제해야 할 것이다.
신경망 번역 이후 2019년 기준 영어와의 번역의 정확도가 높은 언어를 꼽자면 스페인어(90% 이상)> 타갈로그어, 중국어, 한국어(80~90%)> 베트남어 > 페르시아어(67%) > 아르메니아어(55%)다. 번역 데이터가 단순히 많으면 정확도가 향상됨을 알 수 있다. 같은 인도유럽어족인 페르시아어, 아르메니아어보다 한국어와의 번역의 정확도가 훨씬 높다. #
구글 번역은 어떤 언어를 번역할 때 여러 개의 표준이 있는 언어라면 그 언어들을 통틀어서 가장 많이 쓰이는 형태를 제공한다. '색깔'의 경우 영어로 번역할 때 추천되는 어구로 미국식인 'diversity of colors'와 영국식인 'diversity of colours'를 모두 제공하는데, 통번역에 있어서는 '미국식 영어'와 '영국식 영어'를 하나로 보는 것으로 파악된다. 여기에 그 언어 전체에서 많이 쓰이는 형태와 유사한 어구라면 방언과 같은 다소 특이한 말투도 신경망 번역으로 번역이 가능하고, 심지어 북한의 표준어인 문화어를 넣고 번역시켜도 다른 언어로 번역이 가능하다. 만약 영어를 북한에서만 쓰일 수 있는 상황을 묘사하여 '북한스럽게' 쓴다면 '력사적 과업' 같은 어구가 등장한다.
4.1. 정상적인 번역 예시
4.1.1. 한국어→영어/러시아어
- 대한민국은 민주공화국이다.
대한민국의 주권은 국민에게 있고, 모든 권력은 국민으로부터 나온다.
→ Республика Корея является демократической республикой.
Суверенитет Республики Кореи и вся государственная власть исходит от народа. (러시아어)
→ The Republic of Korea is a Democratic Republic.
The sovereignty of the Republic of Korea lies in the people, and all power comes from the people. (영어)
4.1.2. 프랑스어→한국어
- Ô Canada! Terre de nos aïeux,
→ 오 캐나다! 우리 조상의 땅
4.1.3. 중국어→한국어
4.1.4. 영어→한국어
Break a leg!→ 행운을 빌어!
4.2. 나쁜 번역의 예
* 앞으로 나쁜 번역의 예시를 생성할 때 다음 기준 중 하나를 따라야 한다. 작성시 근거를 반드시 제시해야 하는 것은 아니나, 토론이 열릴 경우 존치 측이 근거를 우선적으로 제시해야 한다.
1. 단어일 경우, 해당 단어가 현실이나 제도권 언론 등에서 쓰인다는 근거가 있다. 또한 인터넷 밈이나 가상의 언어가 아니다.
1. 문장일 경우, 해당 문장이 어법상 성립할 수 있는 문장이다. 또한 문장을 구성하는 단어 중 이전의 조건을 위배하는 단어가 없다.
1. 오역의 사례로 제도권 언론에 보도된 적이 있다.
종전까지는 어순을 고려하지 않고 단어별로 번역을 하는 문제점을 보였지만, 딥러닝 기술이 적용되면서 문장을 통째로 읽고 번역하는 방식으로 작동원리가 변화했고, 점점 오역의 수는 줄어들고 있다. 이는 다른 번역기도 마찬가지다.1. 단어일 경우, 해당 단어가 현실이나 제도권 언론 등에서 쓰인다는 근거가 있다. 또한 인터넷 밈이나 가상의 언어가 아니다.
1. 문장일 경우, 해당 문장이 어법상 성립할 수 있는 문장이다. 또한 문장을 구성하는 단어 중 이전의 조건을 위배하는 단어가 없다.
1. 오역의 사례로 제도권 언론에 보도된 적이 있다.
아래 예시들은 제대로 된 것도 있으나 일부는 그냥 재미로 써놓은 것이므로 딱히 번역기의 성능 수준을 가늠하는 용도로는 의미가 없으니 순전히 흥미위주로만 보자. 어느 번역기든 컴퓨터가 이해하는 '문맥'이라는 것은 번역의 대상이 되는 문장이 길수록 적용이 쉽고, 번역기에 문맥에 대한 정보가 제공되지 않으므로 몇 단어만 적어 놓으면 당연히 틀린 번역이 나올 가능성이 매우 높다. 이런 문제점을 보완하기 위해 영어 같은 언어는 한 단어를 입력할 때만 적용되는 부분이지만 아예 의미의 사용 빈도를 제공한다.
또한 그 중 일부 사례는 장난성 트롤링[18] 및 정치적 악의를 가지고 신청한 번역 제안이 최우선으로 적용되면서 나온 것으로 여겨진다. 그리고 홍콩에서는 2019년 8월 홍콩 범죄인 인도법 반대 시위 정국과 관련, '홍콩은 중국의 일부가 되는것을 보는 게 슬프다'라는 뜻의 영어를 중국어(번체)로 번역하면 '홍콩은 중국의 일부가 되는 게 기쁘다'라는 정 반대의 뜻으로 번역되는 악질적인 사례도 보고됐다. #[19] 물론 문제 제기 이후로는 악성 제안이 교정됐다.
신경망 번역 이후의 번역을 구분하기 위해서 삼각형 화살표( ▶ )로 표시한다.
4.2.1. 영어 → 한국어
밑줄 친 파란색 글씨는 2019년 9월 15일 기준 번역 결과- Add oil → 오일을 추가 - 홍콩 영어로 "힘내" 라는 뜻[20]이다. [21][22]
- asleep → 죽어
- fuck → 못쓰게 만들다[23]
- Fire in the hole → 구멍에 화재 ▶ 구멍에 불 → 구멍에 불이 났다. → 구멍에 불 → 폭발한다. 구멍에 불 과거에는 번역 자체도 이상했고 문장 부호에 따라 조금씩 다르게 해석됐지만 다시 문제 없이 해석됐다가 [24] 구멍에 불이라고 번역된다.
- Watch your step. → 당신의 단계를 시청.[25] [26] [27] [28] 당신의 단계를 시청! → 당신의 단계를 시청.[29] → 발걸음을 조심하세요.(2024년 8월 30일 기준)
- birthday suit → 생일 옷[30] [31] → 생일날 복장
- Sailor Moon → 선원 달 - 예전부터 고쳐지지 않고 심지어 커뮤니티 공식 인증을 받았다고 되어있다.
- O say can you see, by the dawn's early light, → 새벽이 밝게 빛나면서 → 오 새벽이 밝아서 → 오, 새벽의 이른 빛으로 볼 수 있습니까?
- Copy that, I'm on my way. → 그걸 복사해서, 나는 가고있다.[32][33] → 복사해 가겠습니다.
- l can't stress this enough. → 나는 이것을 충분히 강조할 수 없다. → 이 점은 얼마나 강조해도 지나치지 않습니다.(2024년 8월 30일 기준) [34]
- sheet music → 망할 음악.[35]
- SpongeBob SquarePants → 스폰지 밥 보글
- How did you do that? → 당신은 그렇게 않았다 방법?[36] - 이것 또한 오래 전부터 고쳐지지 않았었고 커뮤니티 공식 인증까지 받았다.
- I'm going to go to the middle of the day → 2020년 12월 1일 → ㅋ ㅋ ㅋ[37][38] → 나는 한낮에 갈 것이다(2024년 8월 30일 기준)
- General → 일반적인 - '장군' 이라는 뜻으로 쓰인 부분에서도 간혹 저렇게 번역될 때가 있다.
- I told you so → 내가 그렇게 말했[39] → 내가 그렇게 말했잖아
bee ->벌->punishment->처벌
->bee=punishment
- Get some rest → 좀 쉬[40]
- 일부 번역에서 EN ▶ KO (예시: EN : Funny)
- 일부 번역에서 English ▶ 한국어 (예시: English: Down girl!)
4.2.2. 한국어 → 영어
- 동족혐오 → homophobia(homophobic)[41]
- 옛날에 백조 한 마리가 살았습니다. ▶ The 100,000,000,000,001 lived long ago.[42]
- 백조 백조(100,000,000,000,000) 마리 → swan swans
- 머리를 써라 → Write your head → Use your head. → Wear your head → use your hair
- 꿩먹고 알먹고 → Eat pheasants and eat eggs
- 고자라니 → High jarani → And jarani → i am grown up → i am eunuch! → I grow up. → She grows up. → Grows up[43] ▶ Gojarani
- 내가 고자라니! - I am growing up!→ I want to go! → I am growing up!→ I'm an old man! [44] → I grow up! → I'm old man![45] → I'm dying ▶ I can't believe I'm a eunuch![46]
- 이보시오 의사양반 → See the Doc. ▶ I saw this doctor ▶ Ivosio Doctor [47]
- 영문을 모르겠어 → I do not know English.
- 오졌다 → It's gone → It has come → came
- 씨가 말랐다. → Mr. skinny → Mr. dried up[48] ▶ Mr. ▶ seeds are dry
- 주상전하 납시오 → Pillar charges napsioh.[49] ▶ Thank you. [50] → Contact Us → About Us → Contact Us → Give me your main charge
- 풍악을 울려라 → D ring the pungak ▶ Ring the wind ▶ sound the wind[51]
- 나무아미타불 관세음보살 → Wood Amitabha Buddha Avalokitesvara → Tree Amitabha Blessing Bodhisattva Bodhisattva ▶ Wood Amitabh Bourgeois Bodhisattva Bodhisattva [52] → Tree Amitabha Blessing Bodhisattva Bodhisattva → Namu Amitabha Avalokiteshvara Bodhisattva ▶ Wood Amitabha Avalokitesvara Bodhisattva
- 남사친 → Anxious ▶ Namshin ▶ Nam → Boyfriend
- 여사친 → Wife ▶ Girlfriend
- 통촉하여 주시옵소서. → Please give me your money. ▶ Please contact me.
- 성은이 망극하옵니다. → The castle is a reticent. → The castle is in vain ▶ Sung-eun is utterly overwhelmed. ▶ Seong-eun is embarrassed.
- 지랄하고 자빠졌네 → I'm sick and sleepy → I'm bored and bored → I'm sick and tired
- 고만해 미친놈들아 - You're crazy. ▶ I'm still crazy ▶ I'm sorry you crazy people
- 요소수 → number of elements
- 천방지축 → Cloth prevention shaft → the heavenly shaft → cowardice
- 직박구리 → straight gourd → straight copper
- 오목눈이 → concave eyes
- 우리은행 → Our bank[53]
- 무사 → Musa[54]
- 아빠가방에들어가신다 → Dad goes into the bag
4.2.3. 한국어 → 일본어
- 고자 → ゴーザ
- 돼지비계 ▶ 豚の足場
돼지 발판[55] - 지랄 → 性交 → ジラル
- 개새끼 → サンズ → 犬の子
- 쪽발이 → 日本人
???→ 側足 - 깔따구 → 漏斗
- 너구리 → アライグマ[56]
- 요소수 → 要素数
- 똥 → たわごと[57]
- 오바마 온천 → オバマ温泉
- 세발낙지 → 三足タコ
- 핼리 혜성 → ハリー彗星[58]
4.2.4. 일본어 → 한국어
- パクチー → 박지성 → 박치
- 冠する(관을 씌우다) → 곰 → 왕관하다
- 각종 숫자[59]
- いーあるふぁんくらぶ → 이순신의 환쿠라부 いー 또는 イー를 이순신으로 번역하는 문제. → 있어
- へんぷく → 辺幅 : 진짜로 일본어 → 중국어 간체가 아니라 일본어 → 한국어로 설정해놓은 결과 맞다. 일본어 → 중국어 간체로 설정해놓으면 이거 말고 다른 결과가 나온다. 2022년 2월 기준으로는 헨푸쿠라고 번역되다가 12월 기준 떡볶이라고 번역됨
- スーパーカブ → 슈퍼 새끼 : 고유명사이지만 cub를 원래 뜻으로 옮겨서 생긴 오류. 게다가 욕설을 연상시킬 수 있다. 반대로 새끼가 カブ라고 번역되는 경우도 많다. 과거에 생성된 영어로 중역을 거친 일부 결과가 그대로 사용되는 듯.
- もちもちほっぺ → 떡볶이
- キャル → 칼 : 이전에는 '캐르'나 '캬'라고 나왔었다.
- たわごと → 똥[60]
4.3. 다른 외국어
신경망 번역을 적용하기 이전에는 아래와 같은 문제가 있었다.사실 구글 번역기의 성능이 좋지 않은 게 아니라 한국어 - 영어 번역만 이상하리만치 어색한 것이다. 아무래도 영어와 한국어는 어휘, 문장 구조가 판이하다. 어순뿐 아니라 표현하는 방식 자체도 달라서 기계번역의 난이도가 더 어려운 것 같다. 그리고 은어나 속어를 많이 사용하는 문제도 있다. 실제로 인도-유럽어족의 언어를 사용한 번역의 품질은 타의 추종을 불허한다. 러시아어↔영어, 프랑스어↔영어,[61] 독일어↔영어, 이탈리아어↔영어, 네덜란드어↔영어, 스페인어↔영어, 아랍어↔영어등의 번역 품질은 긴 문장을 번역하더라도 흠이 거의 없는 완벽한 문장에 가깝다.[62] 또한 한국어와 어순이 비슷한 일본어도 번역이 잘된다. 때문에 생소한 외국어 사이트에서 정보를 알게 될 때 적어도 영어만 잘하면 거의 전세계 인터넷의 언어 장벽이 무너지는 셈. 크롬에서 디폴트 번역을 영어로 설정하고 돌아다니면 페이지가 아예 처음부터 영어였던 것마냥 오류 없이 깔끔하게 영어로 나오는 걸 볼 수 있다. 핀란드어의 경우 북유럽 언어인데도 밑의 노르웨이어, 스웨덴어, 덴마크와 달리 상당히 꼬인 결과물이 나오는 것으로 볼 때, 번역 완성도가 어순과 어족의[63] 영향을 많이 받음을 알 수 있다.
재밌는 점은 신경망 번역 도입 이전부터 일본어↔영어 번역만은 어순이 아예 다름에도 정확도가 독보적으로 높았다는 점이다. 일본어는 동인지 등 문화 폭탄의 산물들을 번역하는 과정에서 양덕후들에게 수도 없이 교정됐기 때문이다. 하지만 어순이나 문법도 다르고 딱히 일본계 양덕들이 교정할 필요도 없는 외국어들은 정확성이 확실히 떨어진다.
2022년 현재는 그냥 번역 횟수가 많고, 서로 유사한 언어가 번역의 정확도가 높다. 앞서 언급한 원리에 따르면 어떤 언어를 아무 언어로 번역하기만 하면 한국어로의 번역 품질도 좋아진다. 좀 더 정확히는 데이터가 많이 들어간 언어가 정확한데, 데이터가 적은 언어들은 최근 들어 영어 데이터가 많은지 영어처럼 번역한다. 한국어 → 외국어 → 한국어로 번역할 때 외국어 자리에 생소한 언어가 들어가면 영어와 비슷한 결과물이 나온다. 예외는 거의 일본어, 중국어 정도다. 이는 영어와 문법 체계가 크게 다른 언어의 경우 한국어와 문법이 비슷한 언어라도 오역이 나오기 더 쉬울 수 있음을 암시한다.
(예시)
중국어↔영어
中國是東亞的一個國家或地理區域, 漢語中最早是泛指炎黃子孫在中原建立的國度, 至現代國際體系成形後才開始作為國家的通稱。 → China is a country or geographic area in East Asia, Chinese, refers to the descendants of the earliest establishment of the kingdom in the Central Plains, to the shaping of modern international system after the country began as a generic term. 매우 완벽한 번역이다. 이는 영어와 중국어의 어순이 거의 일치하는 것이 아니라 중국어 문법현상이 간단하기 때문에 가능한 것이다. 영어와 중국어의 어순은 대조해 보면 알겠지만 SVO(주어-술어-목적어)라는 기본 형식를 제외하면 완전히 다르다. |
러시아어↔영어
Республика Корея является демократической республикой. Суверенитет Республики Корея и народа, и всей государственной власти должны исходить от народа. → The Republic of Korea is a democratic republic. The sovereignty of the Republic of Korea and the people, and all state power must come from the people. |
프랑스어↔영어
La France, en forme longue la République française, est un pays d'Europe de l'Ouest, mais qui comprend également plusieurs régions et territoires d'outre-mer disséminés sur plusieurs océans. → France, French Republic in the long form, is a country in Western Europe, but also includes several regions and overseas territories scattered across several oceans. |
독일어↔영어
Deutschland (Vollform Bundesrepublik Deutschland) ist ein bundesstaatlich verfasstes Land in Mitteleuropa und wird aus den 16 deutschen Ländern gebildet. → Germany (Federal Republic of Germany long form) is a federal penned country in Central Europe and is composed of the 16 German states. long form과 penned를 빼면 그다지 트집 잡을 곳은 없다. → Germany (Vollform Bundesrepublik Deutschland) is a federal state in Central Europe and is formed from the 16 German countries. [2016.12.15. 기준] 신경망 번역이 적용된 후 번역이 더욱 매끄러워졌다. 그런데 괄호안의 문구는 해석되지 않았다. 괄호안의 문구를 따로 해석하면 Full form of the Federal Republic of Germany으로 번역된다. |
이탈리아어↔영어
L'Italia, ufficialmente Repubblica Italiana, è una repubblica parlamentare situata nell'Europa meridionale, con una popolazione di 59,7 milioni di abitanti e capitale Roma. → Italy, officially the Republic of Italy, is a parliamentary republic located in southern Europe, with a population of 59.7 million inhabitants and capital of Rome. |
네덜란드어↔영어
vraag niet naar de weg want iedereen is de weg kwijt → do not ask for directions because everyone has lost its way |
노르웨이어↔영어
Kongeriket Norge er et nordisk, europeisk land og en selvstendig stat vest på den skandinaviske halvøy. Landet er langt og smalt, og kysten strekker seg langs Nordatlanteren, hvor også Norges kjente fjorder befinner seg. → Kingdom of Norway is a Nordic European countries and an independent state west of the Scandinavian Peninsula. The country is long and narrow, and the coastline stretching along the North Atlantic, where Norway's famous fjords are located. |
덴마크어↔영어
Danmark (fra oldnordisk: Danernes mark) er et land i Skandinavien beliggende i det nordlige Europa. Danmark kaldes sammen med Grønland og Færøerne officielt Kongeriget Danmark. → Denmark (from Old Norse: Danes Mark) is a Scandinavian country located in northern Europe. Denmark is officially called the Kingdom of Denmark together with Greenland and the Faroe Islands. |
스와힐리어↔영어
Lugha ilianza takriban miaka 800-1000 iliyopita katika mazingira ya vituo vya biashara vya pwani ambako wafanyabiashara kutoka Uarabuni, Uajemi na Uhindi walikutana na wenyeji Waafrika. → Language started almost a decade ago in the context 800-1000 to coastal trading centers where traders from Arabia, Persia and India met with local Africans. |
헝가리어↔영어
A magyar nyelv az uráli nyelvcsalád tagja, a finnugor nyelvek közé tartozó ugor nyelvek egyike. A legnagyobb finnugor (és egyben uráli) nyelv. Legközelebbi rokonai a manysi és a hanti nyelv, majd utánuk az udmurt, a komi, a mari és a mordvin nyelvek. → The Hungarian member of the Ural language family, one of the Finno-Ugric languages belonging languages. The largest Finno-Ugric (and Ural) language. The closest relatives of the Khanty Mansi and language, and after the Udmurt, Komi, Mari and Mordvin languages. |
터키어↔영어
Mustafa Kemal Atatürk, Türk ordu subayı, mareşal ve Türkiye'nin ilk cumhurbaşkanı. Türkiye Cumhuriyeti'nin kurucusu ve önderidir. 1934'te Türkiye Büyük Millet Meclisi tarafından kendisine Türklerin atası anlamına gelen Atatürk soyadı verilmiştir. → Mustafa Kemal Atatürk, Turkish army officer, marshal and Turkey's first president. He is the founder and leader of the Republic of Turkey. In 1934, the Grand National Assembly of Turkey gave him the surname of Ataturk, which means that he was the father of the Turks. |
몽골어↔영어
Чингис хаан (~1162 - 1227 оны 8 сарын 18) 1206 онд Монгол аймгуудыг нэгтгэж Их Монгол Улс буюу Монголын эзэнт гүрнийг байгуулсан Монголын хаан байв. Хиад Боржигин Есүхэйн Тэмүжин (Тэмүүжин ч гэж бичдэг) гэдэг нэртэйгээр Боржигин овогт төрсөн бөгөөд түүхэн дэх хамгийн гарамгай улс төр, цэргийн суут удирдагч юм. → Genghis Khan (~ 1162 - 8 May 1227, 18) In 1206, Mongolian tribes were united Mongolian Mongolian Khan established the Mongol Empire.Khiad and Borjigin Yesükhein Temujin (Temujin would say), was born in the tribe called the Borjigin the most outstanding in the history of political and military leader of genius. → Genghis Khan (~ 1162 - In 1206, 8 May 18, 1227), combined with Mongolian tribes of the Mongolian State or, according to the king of an empire Mongol Empire. Coat Borjigin Yesükhein Temujin (Temujin not to write), is a born leader tribe Borjigin name is the most prominent political and military genius in history. [2016.12.15. 기준] → Chinggis Khaan (~ 1162 - August 18, 1227) was the Mongol emperor of the Mongol Empire, which was merged with the Mongol tribes in 1206. Hiya Borjigin was born in the tribe of Borjigin, known as Temujin (Temujin), and is the most prominent political and military leader in history.[2017.9.10. 기준] |
이쪽은 매우 안 좋은 사례. 원문에 없는 외계어가 출현하진 않았지만, 이해에 필요한 기초 문법 체계가 붕괴됐다...는 2017년 들어서 딥러닝 기술에 기반한 번역 시스템이 자리를 잡고 이해에는 큰 문제가 없는 번역어를 보여준다.
2023년 현재는 한국어로도 "징기스칸(~1162년 - 1227년 8월 18일)은 몽골 지방을 통일하고 1206년 대몽골 제국 또는 몽골 제국을 세운 몽골 왕이었습니다. Hiad Borjigin은 Borjigin 일족에서 Yesuhein Temujin(Temujin이라고도 함)으로 태어나 역사상 가장 위대한 정치 및 군사 천재 지도자입니다."라며 문맥을 이해할 수 있는 문장이 등장한다.
영어↔폴란드어
men are beautiful → mężczyźni są piękni
라틴어↔한국어
- A Mari Usque Ad Mare →마리 광고 마레 → 바다에서 바다로[64]
- Hanc marginis exiguitas non caperet → 이 이익률은 곤란을지지 않습니다 → 이 벼랑의 짧음, 그는 → 여백의 작음은 그를 데려 가지 않을 것입니다
- Hanc marginis exiguitas non caperet. → 이 여백 짧은 여지가 없었다. → 이 위기가 짧아서 그는 그녀를 가둘 수 없었습니다. → 마진의 작음은 그를 데려 가지 않을 것입니다.
Quaestio VIII.
Propositum quadratum dividere in duos quadratos.
Imperatum sit ut 16. dividatur in duos quadratos. Ponatur primus 1Q. Oportet igitur 16. - 1Q. aequales esse quadrato. Fingo quadratum a numeris quotquot libuerit, cum defectu tot unitatum quod continet latus ipsius 16. esto a 2N. - 4. ipse igitur quadratus erit 4Q. + 16. - 16N. haec aequabuntur unitatibus 16. - 1Q. Communis adiiciatur utrimque defectus, et a similibus auferantur similia, fient 5Q. aequales 16N. et fit 1N. 16/5. Erit igitur alter quadratorum 256/25. alter vero 144/25. et utriusque summa est 400/25. seu 16. et uterque quadratus est. Observatio domini Petri de Fermat. ubum autem in duos cubos, aut quadratoquadratum in duos quadratoquadratos, et generaliter nullam in infinitum ultra quadratum potestatem in duos eiusdem nominis fas est dividere cuius rei demonstrationem mirabilem sane detexi. Hanc marginis exiguitas non caperet.
→질문 8.Propositum quadratum dividere in duos quadratos.
Imperatum sit ut 16. dividatur in duos quadratos. Ponatur primus 1Q. Oportet igitur 16. - 1Q. aequales esse quadrato. Fingo quadratum a numeris quotquot libuerit, cum defectu tot unitatum quod continet latus ipsius 16. esto a 2N. - 4. ipse igitur quadratus erit 4Q. + 16. - 16N. haec aequabuntur unitatibus 16. - 1Q. Communis adiiciatur utrimque defectus, et a similibus auferantur similia, fient 5Q. aequales 16N. et fit 1N. 16/5. Erit igitur alter quadratorum 256/25. alter vero 144/25. et utriusque summa est 400/25. seu 16. et uterque quadratus est. Observatio domini Petri de Fermat. ubum autem in duos cubos, aut quadratoquadratum in duos quadratoquadratos, et generaliter nullam in infinitum ultra quadratum potestatem in duos eiusdem nominis fas est dividere cuius rei demonstrationem mirabilem sane detexi. Hanc marginis exiguitas non caperet.
둘로 정사각형 분할의 목적은 제곱.
16. 두 제곱으로 나눌 수 명령했다. 첫 번째 분기 퍼팅. 16. 그것은 필요가있다 - 1 분기. 광장과 동일. 그들이하는 단위의 많은에서 멀리 떨어지는로 (16)의 측면에 포함되어하시기 바랍니다 많은만큼 숫자의 Fingo 사각형, 2N합니다. - 4. 4 분기가 될 광장에 따라서이었다. + 16 - 16N. 1 분기 -이 16 대와 동일하다. 5Q 것이다 첨가 유사한 것들을 제거 모두 일반적인 부족이있다. 16N과 동일. 그것은 1N된다. 16/5. 그리고 그것은 사각형의 25분의 256 중 하나가 될 것입니다. 다른 25분의 144이었다. 두 최고 25분의 400. 16 그리고 둘, 또는 광장입니다.선생님 피터 드 페르마의 준수. 이 두 큐브, 또는 quadratoquadratos의 quadratoquadratum으로 큐브, 그리고 일반적으로, 그것의 무한한 힘에 같은 이름의 두 사람은, 참으로, detexo을이 문제의 멋진 데모의 2 승을 분할하는 것보다 더 많은입니다. 이 여백 짧은 여지가 없었다.
네 가지 사례 모두 한국어와 라틴어 사이의 번역 데이터가 현저히 적어서 일어나는 현상일 것이다. 쓸 일이 있다면 그냥 영어를 통해서 중역하도록 하자... 였지만 번역 데이터가 쌓이며 이해가 가능한 문장이 생기기 시작했다. 영어 수준의 번역이다.
질문 8
목표는 사각형을 두 개의 사각형으로 나누는 것입니다.
16. 두 개의 사각형으로 나누라는 명령을 받았습니다. 1분기로 가정 따라서 16. - 1Q가 필요하다. 제곱과 같아야 합니다. 16의 변만큼 많은 단위의 결함이 있는 원하는 만큼의 숫자로 구성된 제곱을 상상해 보십시오. 2N이 됩니다. - 4. 따라서 사각형 자체는 4Q가 됩니다. + 16. - 16N. 이들은 단위 16과 같습니다. - 1Q. 공통점에 양쪽의 부족함을 더하고, 같은 것에서 같은 것을 빼면 5Q가 될 것이다. 16N과 동일 1N이 됩니다. 16/5 따라서 두 번째 정사각형은 256/25가 됩니다. 다른 하나는 144/25입니다. 둘의 합은 400/25입니다. 또는 16. 그리고 각각은 정사각형입니다. Peter de Fermat 경의 관찰. 이제 정사각형을 두 개의 정육면체로 나누거나 정사각형을 두 개의 정사각형으로 나누는 것이 옳습니다. 일반적으로 정사각형을 넘어 무한대까지 같은 이름을 가진 두 개의 거듭제곱은 없습니다. 저는 확실히 놀라운 증명을 발견했습니다. 마진의 작음은 그를 데려 가지 않을 것입니다.
라틴어 ↔ 영어
- Quod vadis, domine? → What are you going, my lord?
체코어 → 한국어
- ...a je to! → 그리고 그게 다야! → ... 끝났습니다!
포르투갈어 → 한국어
- Ordem e Progresso → 주문 및 진행 → 질서와 진보
폴란드어 → 한국어
- Polski → 광택
한국어 → 중국어
한국어 → 프랑스어
4.4. Google 번역 개선하기
번역 커뮤니티2011년 1월에 Google 번역이 엉망일 경우 사용자가 직접 번역을 개선할 수 있는 서비스가 생겼다. 사용자가 제공한 번역은 번역 품질을 개선하는 데 사용되고 익명으로 다른 사용자에게 표시될 수 있다고 명시했지만, 사실은 Google에서 사용자가 제공한 번역을 일일이 검토하여 최종적으로 사용하므로 꽤 까다롭다. 즉 사용자가 엉터리로 번역을 개선했다면 당연하겠지만 철저히 무시당하고 개중에 올바르게 번역을 개선한 부분이 선발되어 새롭게 표시된다는 것이다. 이 과정은 보통 한 달 정도가 소요된다고 한다. 이 점은 중국 바이두 백과와 비슷하다.
실제로 카자흐어를 번역 커뮤니티를 통해서 200만 개 이상의 자료를 확보한 후 서비스를 시행할 수 있었다. 이후 번역 커뮤니티를 통해 스리랑카어 등 13~14개의 언어 데이터를 확보하여 서비스를 했다.(관련 기사)
4.5. 장점
번역의 기능으로 사용하지 않더라도 훌륭한 외국어 학습의 도구가 될 수 있다. 가령 특정 단어를 입력하거나 문장을 입력하고 읽기를 누르면 원어민의 목소리로 문장을 들을 수 있으며. 단어를 검색하는 경우 뜻과 그 풀이, 사용 용례와 발음 기호가 나온다.지원하는 언어가 많고, 이런 언어들은 한국어로 직역하는 과정이 없어도 번역이 가능하므로 특수외국어 수준의 한국인이 잘 모르는 언어를 번역하여 의미를 해석하는 데도 쓰일 수 있다. 가령 우크라이나어는 다른 번역기의 러시아어 번역을 사용하고자 해도 구글 번역의 결과물이 다른 번역기의 러시아어 번역보다 매끄럽게 읽혔다. 2023년 들어 우크라이나어는 DeepL도 한국어로 번역할 수 있게 되었고, DeepL의 러시아어나 우크라이나어 번역 성능이 구글보다 뛰어난 편이지만 동남아 등지의 언어는 아직 구글 번역이 우세하다. 이하 아래의 번역물은 모두 직역의 결과물이다. OpenAI사가 ChatGPT에서 이용가능한 GPT-4를 활용한 유료 모델을 내놓았고, Claude3 Opus 이상의 언어 모델, Gemini 1.5 이상의 생성형 인공지능 같은 다른 서비스도 번역 성능이 뛰어나서 이것으로 번역을 요청하면 비서구권의 언어를 심지어 일부 통신체까지 해석할 정도로 구글 번역보다 성능이 뛰어난 편이지만 무료 버전 중, 특히 크롬 번역이 활용될 수 있는 범용성 면에서는 장점이 있다.
Вчора ми втратили, на жаль, нашу «Мрію». Але стару «Мрію». А нову ми зараз будуємо.
→ 어제는 슬프게도 우리의 "므리야(An-225)"를 잃었습니다. 그렇지만 오래된 므리야(An-225)입니다. 그럼에도 지금 우리는 새 것(므리야(꿈))을 만들어 갑니다. (원어)
→ 불행히도 우리는 어제 "꿈"을 잃었습니다. 그러나 오래된 "꿈". 그리고 우리는 지금 새로운 것을 만들고 있습니다. (구글)
→ 불행하게도, 우리의 "Mriya"는 낭비됐다. "Mriyu"는 늙었다. 그리고 이제 우리는 새로운 것을 할 것이다. (번역1)
→ 미안, 우리 "Mrue"를 썼어. "Mrue"의 오래된 "Mrue"에 대한. 그리고 새로운 감염은 있을 거야. (번역2)
다른 크메르어, 미얀마어, 우즈벡어 같이 한국 내 구사자가 있으나 전문 번역 인력이 드문 언어는 구글 만이 번역할 수 있는 경우도 많고, 운문이 아닌 산문은 몇 가지 단어를 문맥에 맞지 않는 단어로 번역하나 대체로 뜻은 통하는 경우도 있다. 이런 언어를 번역하는 다른 번역기도 있지만 구글 번역의 품질이 가장 좋다. 다만 운문의 번역 품질은 떨어지고, 정확성 면에서 자사의 Gemini 1.5 Pro가 속도와 비용의 문제가 남아 있지만 정확성 측면에서 더 좋은 번역을 제공한다. 정확도 비교를 위해 Gemini 1.5 Pro로 번역된 문장도 써놓았다.
크메르어
អ្នកកាន់ថេរវាទមានជំនឿថា បុគ្គលម្នាក់ៗទទួលខុសត្រូវដោយខ្លួនឯង ចំពោះការត្រាស់ដឹងនិងការរំដោះខ្លួន ព្រោះថាគេជាទទួលខុសត្រូវ លើកម្មផលរបស់គេ ។ ដោយគ្រាន់តែសិក្សានិងជឿតាមសេចក្តី ពិតនៃសច្ចធម៌ដែលព្រះពុទ្ធបានពន្យល់ប្រាប់ មិនគ្រប់គ្រាន់ឡើយ ការត្រាស់ដឹងអាចសម្រេចបាន តែតាមការពិសោធន៍និងការយល់ ដឹងផ្ទាល់ខ្លួនប៉ុណ្ណោះ ។
→ 테라와다 신자들은 각 개인이 자신의 깨달음과 해방에 책임이 있으며 자신의 카르마에 책임이 있다고 믿습니다. 부처님께서 설하신 진리를 연구하고 믿는 것만으로는 충분하지 않으며 깨달음은 개인적인 경험과 이해를 통해서만 이루어질 수 있습니다.(구글 번역)
→ 테라바다 불교 신자들은 각 개인이 자신의 깨달음과 해탈에 대한 책임이 있다고 믿습니다. 왜냐하면 각자 자신의 업의 결과에 책임이 있기 때문입니다. 부처님께서 설하신 진리의 가르침을 배우고 믿는 것만으로는 충분하지 않습니다. 깨달음은 오직 자신의 경험과 깨달음을 통해서만 얻을 수 있습니다.(Gemini 1.5 Pro)
미얀마어
ကန့်ကွက်ဆန္ဒပြမှုများသည် ၁၉၈၈ ခုနှစ် ဩဂုတ်လတွင် အထွဋ်အထိပ်သို့ ရောက်ခဲ့သည်။ ကျောင်းသားများသည် ကိန်းဂဏန်းဆိုင်ရာ ထူးခြားမှုကို အခြေခံသည့် မင်္ဂလာနေ့ဖြစ်သည့် ၁၉၈၈ ခုနှစ် ဩဂုတ်လ ၈ ရက်တွင် နိုင်ငံအဝှမ်း ချီတက်ဆန္ဒပြပွဲပြုလုပ်ရန် စီစဉ်ခဲ့ကြသည်။ ကန့်ကွက်ဆန္ဒပြမှု သတင်းသည် တောနယ်ဒေသများသို့ပါ ရောက်ရှိခဲ့ပြီး နိုင်ငံအဝှမ်း ချီတက်ဆန္ဒပြပွဲမတိုင်မီ လေးရက်အလိုတွင် တစ်နိုင်ငံလုံးရှိ ကျောင်းသားများသည် ဦးစိန်လွင်၏ အုပ်ချုပ်မှုကို ရှုတ်ချကြပြီး တပ်မတော်သားများသည် အင်အား စုရုံးနေခဲ့ကြသည်။ ဗမာနိုင်ငံလုံးဆိုင်ရာ ကျောင်းသားသမဂ္ဂ (ဗကသ) အမှတ်အသားဖြစ်သော ခွပ်ဒေါင်းပုံပါ လက်ကမ်းစာစောင်များနှင့် ပိုစတာများသည် ရန်ကုန်မြို့ရှိ လမ်းများတွင် ထွက်ပေါ်လာခဲ့သည်။
→ 시위는 1988년 8월에 최고조에 달했다. 학생들은 통계적 차이를 바탕으로 결혼식 날인 1988년 8월 8일 전국 행진을 기획했다. 시위 소식이 농촌 지역까지 전해졌고, 전국 행진을 나흘 앞두고 전국의 학생들이 우세인린의 통치를 규탄하고 군인들이 집결했다. 버마 전국 학생회(북타) 상징이 적힌 팜플렛과 포스터가 양곤 거리에 등장했습니다.(구글 번역)
→ 반대 시위는 1988년 8월에 절정에 달했습니다. 학생들은 1988년 8월 8일이라는 수비학적으로 의미있는 날에 전국적인 시위를 계획했습니다. 시위 소식은 시골 지역까지 퍼져나갔고, 전국적인 시위가 있기 4일 전에 전국의 학생들이 네윈 군사 정권을 규탄하며 군인들이 집결하기 시작했습니다. 전국 버마 학생연맹(ABSU)의 상징인 싸우는 공작이 그려진 전단지와 포스터가 양곤 거리에 등장했습니다.(Gemini 1.5 Pro)
우즈벡어
Amir Shohmurod Buxoro amirligida 4 ta: moliya, sud, maʼmuriy va harbiy sohalarda islohotlarni amalga oshirgan. Davlat boshqaruvida adolatni bosh tamoyil qilib olib, shariat normalariga toʻgʻri kelmaydigan barcha soliqlarni bekor qildirgan. Koʻplab XVI—XVII asrlarga tegishli vaqf hujjatlarini qayta koʻchirtirgan; amaldagi yoki butunlay faoliyat koʻrsatmayotgan va yoʻqolgan vaqf hujjatlarini qayta ishga solgan.
→ Amir Shahmurad는 부하라 토후국에서 금융, 법원, 행정, 군사 등 4가지 개혁을 시행했습니다. 그는 정의를 행정의 주요 원칙으로 삼아 샤리아 규범에 맞지 않는 모든 세금을 폐지했습니다. 그는 16세기와 17세기의 많은 기부 문서를 다시 복사했습니다. 기존 또는 완전히 존재하지 않고 손실된 waqf 문서를 다시 활성화했습니다. (구글 번역)
→ 아미르 쇼흐무로드는 부하라 칸국의 통치자로서 재정, 사법, 행정, 군사 분야에서 4가지 개혁을 시행했습니다. 그는 국가 운영에 있어 정의를 최고의 원칙으로 삼고, 샤리아 법에 맞지 않는 모든 세금을 폐지했습니다. 그는 16~17세기에 만들어진 많은 와크프(종교적 재산) 문서를 복원했고, 시행되지 않거나 완전히 효력을 잃거나 유실된 와크프 문서들을 다시 활성화했습니다.(Gemini 1.5 Pro)
4.6. 문제점
- 한국어 같은 경우는 주어를 생략하여 얘기하는 경우가 많은데 영어로 번역할 때 Google 번역은 의도하지 않았던 주어를 내세우는 경우가 있다.(예시)
- 비슷한 예로 두 문장을 번역할 때도 마찬가지인데 첫번째 문장에 주어를 넣고 두번째 문장에 주어를 생략한 후 번역을 할 경우,[67] 첫번째 문장의 주어가 나든 너든 그든 그녀든 우리든 너희든 그들이든 상관없이 두번째 문장의 주어는 기본적으로 나(I)로 나오며 그 문장이 의문문이면 너(You)로 나온다.
- 영어→한국어 번역시 숫자의 경우 다른 숫자는 그대로 표시하지만 유독 3만 "삼"으로 표시한다.
- 단순히 Park이라고만 써도 박근혜, 박 대표, 박 총재, 박정희, 공원, 박 대통령, 박찬호 등의 단어로 번역이 된다. 그냥 박 씨로만 해도 될 것이다. 이와 마찬가지로 Yi는 무조건 이순신으로 번역이 된다. 이 때문에 중국 인물이 포함된 문장을 번역할 때 자꾸 뜬금없이 이순신이 등장하게 된다.
- IT 관련 문장에서 We나 Our가 포함되어 있으면 Google이나 YouTube로 치환되는 경우가 있다. 아마 구글의 번역 데이터를 많이 써서 그런것 같다. 번역 결과창 아래의 '수정 제안하기'를 눌러서 수정해주자.
- 웹에서 주소를 입력하여 사이트 번역을 이용할 시 웹사이트 레이아웃이 깨지는 경우가 있다. 크롬 사이트 번역은 레이아웃이 지켜지나 길이 차이 심하면 간혹 같은 문장을 계속 반복하는 경우가 있다. 이쪽은 중간이나 끝에서 주로 발생. 혹은 중간 문장들을 아예 빼먹고 번역하는 경우가 있다.
- 사이트 번역시 링크가 중간에 포함된 문장을 번역할 때 문장이 이상하게 번역된다. 아마 <a> 태그 때문에 문장이 분리가 되는 듯하다. 신경망 번역이라 문장을 통째로 번역을 하니 구절별로 나눌 수가 없어서 링크 걸기가 어려운 것같다.
→ 2017.01.18. 현재 웹사이트 번역 알고리즘이 번역됐는지 링크가 포함된 문장도 어순에 맞게 번역이 된다. 그런데 이 알고리즘 변경으로 일부 웹페이지의 레이아웃이 깨진다. 당일 오후 10시 경에 다시 확인해본 결과 다시 이전처럼 돌아갔다. 아마 구글 측에서 레이아웃이 깨진다는 걸 인지하고 급히 돌린 것 같다.
- 띄어쓰기 같은 맞춤법이 틀렸을 때가 많다. 예를 들어 "그의 집인 경복궁"이라는 말이 있다면 구글 번역은 "그의 집 인 경복궁"이라고 번역한다. 인은 붙여서 써야하는데 자꾸 떨어뜨려서 쓴다. 이외에도 많은 부분에서 맞춤법을 고칠 필요가 있다.
- 무조건 한 줄마다 끊어서 번역하다보니 노래 가사같은 경우는 여러 줄이 모여야 완성되는 문장인데 한줄씩 번역하는 구글 번역의 경우엔 번역이 잘 되지 않는다.
- 2017년 7월달 전후로 번역시 마우스를 문장에 가져다 대면 그 문장만 팝업으로 원문을 볼수 있는 기능[68]이 있었지만 더 이상 작동하지 않는다. 그나마 구글 공식 번역 확장 프로그램을 설치하고 파란 확장 프로그램 아이콘을 통해 번역해야만 볼수 있다.
모바일은?
- Gmail이나 유튜브에서 다른 나라 언어로 메일을 보내거나 리플을 다는 등 딱히 번역이 필요하지 않거나, 오히려 번역을 해선 안되는 상황에서 자동 번역을 해댄다. 타국가에 메일 보내려고 애써 번역해 타자까지 쳤는데 붙여넣기 하는 순간 한국어로 변환되는 상황의 빡침은 안 겪어본 사람들은 모를 것이다. 심지어 번역 허용 조건에 비해 번역 거부 조건은 쓸데없이 복잡하다.
뿐만 아니라, 한국어 영상에 달리는 자동자막(cc)조차도 영 엉뚱한 글자를 띄운다. 무려 성우들의 영상마저도 이상하게 만든다. 예: “성우 표영재”(음성) → “성 표 형제”(자막), “고기 고기”(음성) → “국기 9기”(자막).
- 사이트 번역 시, 영작 중인 문장마저도 모조리 바꿔버리는 문제점이 존재한다. 이 때문에 외국인과 소통할 때 오해를 살 확률이 높다.
- 크롬이 사용하는 구글 번역은 구글 번역 사이트에서 제공하는 번역과 다르며, 구글 번역 사이트의 번역이 더 정확하다.
- 전반적으로 문장 구조가 특이하거나 어려운 표현은 생소하지 않은 언어도 번역이 어렵다. 동아시아의 언어나 생소한 언어는 이런 경향이 더 심하다. 단어 자체도 특이한 용례의 표현은 번역을 잘 못한다.
- 아직까지 The land has constantly been appreciating[69] 같은 표현을 잘 번역하지 못 한다.
- 일본어의 경우 영어와 일본어 사이를 번역한 데이터가 많고 한국어와의 번역 데이터가 부족한지 생소한 반말투는 존댓말로 번역이 되는 경우가 많다. 일본어 특유의 조사 자체를 번역하는 성능이 한국산 번역기나 DeepL에 비해 떨어지는 편이다.
- 홍콩의 공용어로 지정된 언어임에도 불구하고 광동어 번역을 지원하지 않는다. 이는 구글 측에서 광동어를 별개의 언어가 아닌 중국어의 방언으로 생각하여 번역 언어의 등재 기준에 맞지 않다고 생각하기 때문이다. 따라서 홍콩에 간 관광객들이 광동어를 번역할 때 구글 번역을 사용하지 못해 불편함이 있다. 다만, 홍콩은 영어도 공용어로 지정되어 있어 구글 번역에서 번역 언어를 영어로 하면 되기 때문에 큰 불편함은 없다. 다만 광동어 문어체의 경우 그냥 '중국어'로 인식하여 번역하며, 이해가 가능한 수준의 결과물이 나온다. 당연히 한국어 등을 광동어로 번역은 할 수 없다. 표준중국어를 광동어로 발음하는 TTS를 사용해야 한다.
→ 2024.06.27. 그러나 2024년 6월 대규모 언어 추가가 이루어지면서, 광동어도 지원한다.
- 바벨피쉬가 널리 쓰이던 시절부터 알려진 번역기 자체의 문제지만 언어→다른 언어→입력한 언어 중역시 기괴한 번역이 나온다. 영어보다는 생소한 언어가 이런 현상이 더 심하다, 영어에 한국어를 넣고 한국어로 번역하면 특히 심한 것을 보아 거리가 먼 언어 간에서도 잘 발생하는 듯하다.
- 트위터의 자동 번역이나 크롬의 웹페이지 번역에서 간혹 문장을 통째로 누락하는 경우가 있다. 해당 증상 발생시 누락된 문장의 번역이 안되기도 하지만, 아예 번역에서 통째로 생략되는 경우도 있다.
- 상대적 소수 언어의 경우 그 언어와 번역 데이터가 많은 언어의 영향을 받아 오역이 되는 경우가 많다.
- 프랑스어의 berge 는 강둑이 아니라 영어의 bank의 동음이의어인 bank를 직역한 '은행'으로 번역되기도 한다. 기타 은행과 강둑이 발음으로 구분되는 수많은 언어에서도 강둑이 은행으로 번역되는 사례가 많다.
- 러시아 록밴드 류베(Любэ)는 '윤활유'로 번역된다. 이를 로마자로 표기한 'lube'가 윤활유라고 해석되기 때문이다.
- 우크라이나의 지명은 러시아식으로 읽히는 경우가 많다. 호를리우카(Горлівка)가 한국어로 번역하면 고를로프카(Горловка)로 번역이 된다든가 미콜라이우(Миколаїв)가 니콜라예프(Николаев)의 번형인 '미콜라예프'로 번역된다. 키이우도 간혹 '키예프'가 뜨고 그나마 우크라이나어식으로 지명이 번역되는 사례는 하르키우...
- 아시아권의 언어는 영어보다 호칭어가 발달되어 있다. '나', '저', '형', '누나', '동생' 등의 구분이 일본어나 중국어 등은 영어보다 뚜렷한데[70] 이 구분이 영어의 인칭과 성별만이 기준이 되는 호칭어인 'I'나 'sister', 'brother'를 거쳐 높임의 양상이나 나이의 관계가 뒤바뀌는 사례가 종종 있다. 영어는 '이/그/저'와 같은 구분이 없지만 많은 세계의 언어에서는 유럽의 언어(스페인이나 이탈리아 일대의 언어)라도 이를 비슷하게 구분하는데 영어의 'that'을 거쳐 '그/저'가 모호하게 번역되는 경우도 있다.
- 서울을 중국어로 번역할 경우 2005년부터 쓰이는 표기인 '首尔'이 아닌 이전 표기인 '汉城'으로 번역된다. 다만 '서울의', '서울에서'와 같이 조사가 붙을 경우 '首尔的', '在首尔'으로 정상적으로 번역된다.
4.6.1. 반말, 경어체 관련
- 한국어로 번역할 경우 아직 Google 번역이 반말을 제대로 배우지 못한 모양인지 무조건 '이다, 습니다'로 끝낸다. 이게 얼마나 읽히기 힘드냐면 예를 들어 맥락상 문맥상 "너 많이 힘들어?"를 "당신은 많은 문제가 있습니까?"로 바꾸거나 크롬 번역에서는 '당신은 많은 문제가 존재하는 것 같아 보입니다.'라고 굳이 높임말을 써 가독성이 떨어진다.
사실 파파고가 훨씬 심하다정확히는 같은 문장이라도 대문자로 쓰거나 마침표를 찍으면 존댓말로 변할 확률이 매우 높아지며 같은 문장이어도 단어만 바꾸면 말투가 크게 달라진다. 특히 긴 글은 반드시 존댓말로 번역한다. 한국어의 반말체 문장을 적고 영어나 타 언어들로 옮긴 뒤 다시 한국어로 번역하면 높은 확률로 존댓말 문장으로 비뀐다. - 마찬가지로 한국어를 외국어로 번역할 때도, '주세요'를 Please에 해당하는 단어로 번역하는 등 일부 사례를 제외하면 반말을 넣어도 존댓말을 넣어도 똑같은 문장이 된다. 차이점이라면 반말체 문장은 대문자나 마침표가 없고 소문자로만 쓰는 것이다.
- 한국어를 일본어로 번역할때 존대 여부 확인 없이 무조건 존댓말로 번역된다. 때문에 한국어로 반말로 된 대사를 일본어로 번역하면 갑자기 있지도 않는 존댓말로 번역되는데, 예를 들어 '내 이름은 미란이'를 '私の名前はミランです'로 번역한다. 물론 존댓말 개념이 없는 언어라면 친소어 문법의 경어(존중어)로 번역해도 크게 이상하게 여기지 않아서 이런 문제가 없었겠지만 일본어는 존댓말이 있기 때문에 문제가 될 수 있다. 원문은 반말을 의도했는데 일본어 화자 측에서는 뜬금없이 상대를 높이거나 거리를 두는 것으로 받아들일 수 있다. 이쯤되면 한국어보다 존댓말에 더욱 엄격해서 그런 것으로 생각해 볼 수 있다. 그러나 사실 일본어도 한국어처럼 언어로 타인을 높이거나 낮추는 존비어 문화가 있긴 하지만 한국보다 더욱 엄격하기는커녕 오히려 초면에 만나는 사람이나 친밀해진 윗사람에게 반말을 쓰는 등 한국어보다 더욱 반말을 대수롭지않게 여긴다. 다만 정작 그렇게 번역해 놓고서 한국어로 역번역하면 반말로 나온다. 일본어는 한국어처럼 존비어 문화가 있다보니 파파고에서도 한국어와 일본어만큼은 높임말 옵션을 만들어서 원문이 반말이면 바로 반말로 나오고 높임말을 따로 선택할 수 있게 하는 구조다. 허나 한국어-일본어 외 타 언어에서는 반말 문장과 존댓말 문장의 차이가 잘 표시되지 않는다. 그러다보니 번역기로는 일본어 이외의 경어를 배우기가 참 힘들다.
4.7. 모바일 앱 버전
애플리케이션 | |
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px)" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-6px -1px -11px" | 개인화 및 소셜 |
뉴스 및 미디어 |
[[Chrome| Chrome]] [[구글 포토| 구글 포토]] [[스냅시드| 스냅시드]] [[유튜브| 유튜브]] [[배경화면(구글)| 배경화면]] [[구글 뉴스| 구글 뉴스]] [[Stadia| [[Google Vids| Google Vids]] |
문서 도구 |
[[구글 드라이브| 구글 드라이브]] [[구글 문서| 구글 문서]] [[구글 스프레드시트| 구글 스프레드시트]] [[구글 프레젠테이션| 구글 프레젠테이션]] [[구글 설문지| 구글 설문지]] |
Google Play |
[[Google Play| Play 스토어]] [[Google Play 게임즈| Play 게임즈]] [[Google TV| Google TV]] [[Google Play 북| Play 북]] --[[Google Play 뮤직| Play 뮤직]]-- |
부가 서비스 |
[[구글 렌즈| 구글 렌즈]] [[구글 번역| 구글 번역]] [[구글 애드센스| 구글 애드센스]] Google Ads [[구글 어스| 구글 어스]] [[구글 지도| 구글 지도]] [[구글 카메라| 구글 카메라]] [[구글 카드보드| 구글 카드보드]] 마이 비즈니스 [[구글 트렌드| 구글 트렌드]] 안드로이드 포 워크 |
기기 종속성 |
[[안드로이드 오토| 안드로이드 오토]] [[Wear OS| Wear OS ]] [[Google Pay| 구글 페이]] [[Google Home| 구글 홈]] [[Gboard| Gboard]] [[구글 파이 와이어리스| 구글 파이 와이어리스]] |
서비스가 종료된 구글 서비스 |
[[구글 행아웃| 구글 행아웃 ]] [[구글 알로| 구글 알로 ]] [[구글+| 구글 플러스 ]] [[Google Currents| Currents ]] [[Stadia| Stadia ]] [[Play 뮤직| Play 뮤직]] |
}}}}}}}}} |
안드로이드와 iOS버전으로도 제공하고 있다.
구글 플레이 스토어
App Store
모바일 버전은 다음과 같은 기능을 제공한다.
- 텍스트를 입력하여 90가지 언어 번역
- 카메라를 사용하여 27가지 언어의 텍스트 즉시 번역
- 40가지 언어로 양방향 자동 음성 번역
- 키보드 입력 대신 손가락으로 손글씨 쓰기
- 여행 중 또는 인터넷 요금이 비싸거나 연결 속도가 느릴 경우 언어 팩 다운로드
- 번역에 별표 표시 후 저장하여 나중에 참고하기
- 텍스트를 사진으로 찍어서 높은 품질의 번역 또는 즉석 카메라 번역이 지원되지 않는 언어의 번역 가능
Chrome을 사용하면 Google 번역을 이용해서 웹페이지를 통으로 번역할 수도 있으며, 안드로이드의 경우 블럭을 지정해서 구글 번역기로 공유 버튼을 누르면, 해당 블럭만 번역해서 볼 수가 있다.
4.7.1. 음성 번역
음성 번역을 사용할 때에는 자동 언어 인식이 불가능하니 미리 타겟 언어를 선택해야 한다. A와 B 언어를 선택한 후에 번역할 언어를 눌러서 말하면, 대상 언어로 번역해서 읽어준다. 가운데 마이크 버튼을 누르면, 양방향 번역도 가능하다.4.7.2. 사진 번역
카메라를 띄워서 촬영 버튼을 누르거나 갤러리에 저장된 사진을 불러와서 번역한다. 사진촬영 모드는 37가지 언어를 지원한다.일반적인 OCR에 비해, 일본어와 한자를 꽤 정밀하게 인식해낸다.
4.7.2.1. 비주얼 번역(실시간 카메라 번역)
카메라를 이용해서 보여지는 정보를 실시간으로 번역해서 이미지를 수정하는 기능이다.
실시간 번역 지원언어: 영어, 불가리아어, 카탈로니아어, 크로아티아어, 체코어, 덴마크어, 네덜란드어, 필리핀어, 핀란드어, 헝가리어, 인도네시아어, 리투아니아어, 노르웨이어, 폴란드어, 루마니아어, 슬로바키아어, 스웨덴어, 터키어, 우크라이나어, 프랑스어, 독일어, 이탈리아어, 포르투갈어, 러시아어, 스페인어. 힌디어, 태국어를 지원.+제한적이긴 하지만 일본어, 한국어도 번역가능
2017년 1월 25일자로 영어↔일본어의 실시간 번역이 추가됐다. 처음으로 로마 알파벳 기반 언어가 아닌 일본어가 추가됐으므로, 한국어 업데이트도 기대해볼 수 있는 상황.
2017년 3월 29일자로 영어↔한국어의 실시간 번역이 추가됐다.
여기서 지원하지 않는 언어[71]는 사진촬영 모드로 할 경우 사용 가능하다.
4.7.3. 손글씨 번역
사진 번역으로 인식을 못할 때 사용한다.(화려한 간판 등) 손가락으로 글씨를 그려서 사용하면 된다.5. 관련 문서
6. 기타
PC에서는 번역 결과 칸에서 단어를 클릭하면 번역 전 원본 단어를 달리 번역할 수 있는 동음이의어 목록이 나온다. 이 기능으로 부분적으로 오역된 부분을 손볼 수 있다. 물론 문장 자체가 크게 어긋났다면 이 기능만으로는 못 고친다.PC버전에서 영국 서버를 이용하면 영국식 발음을 들을 수 있다.
닌자 슬레이어 공식 트위터에서는 이것을 '닌자 리얼리티 쇼크로 인해 일어날 사회불안을 숨기기 위해 구글 번역이라는 이름으로 출시한 닌자 슬레이어 GO 2.0'이라고 주장하며 플레이 방법(?)을 실어놓았다. 해시태그 #NinjaSlayerGO로 검색해보면 닌자 슬레이어를 알고 일본어를 아는 사람들이 뿜을 수 있는 짤들이 쏟아진다.
約束された勝利の剣을 검색하면 아래쪽 발음에 Ekusukaribā 라고 뜬다.
사용자 의견 수용도가 높은 서비스여서 다른 번역기가 'ハム太郎'를 그냥 액면 그대로 '햄타로'라고 번역하는 것을 구글 번역기에서는 '햄토리'라고 번역해 주는 등 다소 융통성 있는 번역도 가능하다. 중국어와 일본어 등지에서 연호로 연도로 표기할 때(중국어의 경우 건원(한 세종) 몇 년, 정관(당 태종) 몇 년, 홍무(명 태조) 몇 년, 건륭(청 고종) 몇 년 등이 있고 일본어의 경우 메이지 몇 년, 다이쇼 몇 년, 쇼와 몇 년 헤이세이 몇 년 등) 영어 등으로 번역하면 기독교 문화의 영향 때문에 서기로 바꿔서 번역하기도 한다.
한 예로 2009년 경 初音ミク(하츠네 미쿠)를 한국어로 번역했을 때 이명박으로 번역하던 게 한 때 유명세를 탔다가 수정됐다.
한때 '한국인', '쪽발이'를 일본어 번역하면 日本人으로 나오는 일도 있었고, 일본어 한자 神이 일신교의 유일신인 '하나님'으로 일괄번역된다.[72] 정작 일영번역은 매우 자연스럽다. 아마 양국 네티즌이 상술했다시피 고의성 트롤링으로 제안한 것이 반영된 듯하다.
심지어는 외국어 칸에 돈지랄을 입력하고 번역하면...
초창기에는 이런 식으로 번역되기도 했다고 한다.
다른 언어를 영어로 번역했다가 번역제안 기능 때문에 잘못된 적도 있다.
필리핀어로 피카츄를 영어로 번역했을 때 배트맨으로 나오는 일이 있었다.
스레딕에서는 이 번역기로 번역을 해서 글을 쓰는 스레도 있다.
2016년 1월 기준으로 한국어 TTS 목소리가 병맛 같아졌다. 음질이 낮아졌고, 갑자기 목소리가 갈라진 것 같은 느낌이다. 게다가 악센트가 이상하고 심하게 튕긴다. 일본어 TTS는 음질을 최악으로 낮춰서 그런지 이상하다. 다음 달에는 괜찮아졌지만. 그리고 2016년 3월부터는 음질이 떨어지고 발음 속도도 느려졌다. 2017년 중순부터는 한국어 목소리가 남자로 바뀌었고, 일본어는 두 목소리가 섞여나오고 있다. 그 외에도 영어 등 일부 언어의 목소리도 변경됐다.
참고로 듣기를 한번 누르면 정상 속도로 재생되다가 두번째 누를 때, 느린 속도로 재생된다. 또 한번 더 누르면 정상 속도로 재생된다. 즉, 홀수 번째는 정상 속도, 짝수 번째는 느린 속도로 나온다.
여담으로 Google 번역의 각국 목소리를 뽑아주는 사이트도 있다.(링크)
니코동에서는 여러언어를 거쳐 번역한 대사를 더빙한 영상에 재번역 태그를 단다. 애니 오프닝 등으로 "구글 번역한테 ㅇㅇ을 부르게 해보았다" 같은 영상들도 있는데, 일본어와 영어를 이용한 일부러 음치나 국어책 읽기로 만들어버리는 밈이다.예시 예시2 물론 능력자들에 의한 아예 UTAU처럼 고퀄리티 조교 영상이 있기도 하다.예시 또한 한국에도 구글 번역기 죠죠라는 비슷한 시리즈가 있다.
http://cfile24.uf.tistory.com/image/222CF53C55C2F41C2F6500
예전에 떠돌았던 북한어. 당연하지만 저건 합성이다. 모르겠으면 직접 찾아보자. 실제 북한말이 아니고 공교육 등에서 주장되는 언어 순화를 선전하는 식의 과장된 북한말의 이미지를 나타낸 합성이다. 북한에도 사투리가 있고 문화어라는 표준어도 존재하지만, 문화어 같은 건 '백설공주'는 그냥 '백설공주'라고 한다. '간나'는 북한에서 사투리기 때문에 문화어로 쓰일 수 없다. 구글 지도도 서비스 하는 판에 이건 대북 제재와 무관하겠지만, 일단 중국어의 사례로 보아 다른 언어를 사용한다는 선언이 없는 한 그 서비스는 나올 수가 없다. 대신 북한 연설문을 집어 넣으면 가끔 구글 번역 참여로 확인된 번역이 등장하는 것으로 보아 누군가 구글 번역에 문화어 데이터를 넣고 있는 것으로 보인다. 특히 중국(대륙) 언론에서 보도된 북한 관련 기사를 번역하게 하면 '조선로동당', '력사', '~하시였다'로 번역되는 등, 글의 맥락에 따라 표준어와 문화어를 어느 정도 구별하는 단계에 이르렀다. 물론 맥락상 '(북)조선'이 더 자연스러울 자리에 '북한'이 나오는 등 아직 남한식 표준어에 더 가깝게 번역되기는 한다. 이 기사의 첫 단락을 구글 번역에 넣어 시험해 보자.
한국어-영어에서 띵작, 덍작을 입력하면 A masterpiece가 나온다. 심지어 뼸작을 넣어도 똑같이 A masterpiece가 뜬다.(#)
중국어를 다른 언어로 번역할 때 단어나 문장의 발음을 한어병음으로 표시해 준다. 나름 유용한 기능. 다만 고유명사나 다소 특이한 음으로 읽어야 하는 단어의 경우는 잘못 읽는 경우가 있어 주의해야 하는데, 가령 산맥 이름인 太行은 중국어로 Tàiháng으로 읽는데 Tàixíng으로 나오고 宿는 28수를 뜻할 때는 sù가 아닌 xiù로 읽어야 하는데 그냥 sù로 읽어 버린다.
특정 단어를 일부 언어에서 번역할 경우 이스터에그가 나온다.(#)
Wenn ist das Nunstück git und Slotermeyer? Ja! Beiherhund das Oder die Flipperwaldt gersput.를 영어로 번역할 경우 FATAL ERROR, 즉 오류가 났다는 문구가 뜨는 이스터에그가 있다. 번역 링크
한국어로 "상혁" 이라고 친 후 영어로 번역하면 "Faker" 로 뜬다. 이에 더해 "호성", "성웅", "준식", "재완"을 입력하면 각각 "Duke", "Bengi", "Bang
유튜브의 기계 번역 기능도 구글 서비스이니만큼 구글 번역에 기반하고 있다. 최소 2019년경부터 유튜브 업로더가 영상을 업로드할 때, 제목과 캡션이 해외 시청자에게 자동으로 번역되도록 하는 기능이 있다.구글의 공식 도입 이유. 다만 이게 유튜브 언어를 바꾸지 않는 이상 기계 번역을 원치 않는 비로그인 유저들은 자동번역 여부를 토글할 수 없다는 게 문제.
2020년 9월 15일, 대한민국에서의 웹 번역이 중단됐다. VPN이나 우회툴을 설정하기 어려운 환경에서 Pornhub 등을 웹 통짜 번역 기능으로 임시 우회할때 사용하는 방법 중 하나였는데, 방심위가 불평을 했거나, 트래픽이 너무 많이 몰리는 것이(애초에 프록시 목적로 제공하는 게 아니었으니) 원인으로 추측되지만, Google은 이와 관련된 입장을 내놓지 않고있다. url 번역 기능을 반드시 사용해야 한다면 해외 서버 VPN을 알아보도록 하자.
단, 사이트 번역은 크롬에서 우클릭 후 '한국어(으)로 번역'을 클릭하면 사용할 수 있다.
영어 음성도 영국식이 있고, 미국식이 있다. 여러분이 한국에서 VPN을 사용하지 않고 정상적으로 사용하고 있다면 미국식 억양으로 음성지원된다. 반면에 vpn을 사용하여 라트비아, 리투아니아 같은 곳으로 서버를 할당받는다면 영어 음성 지원이 영국식으로 제공된다.
여담으로 PC 버전에서 듣기를 첫 번째로 누르면 정상 속도로, 두 번 누르면 느리게 재생된다. 다시 세 번째로 누르면 정상 속도, 네 번째 누르면 다시 느리게 재생된다. 이처럼 정상 속도와 느린 속도를 제공하는 것은 외국어 학습을 위한 장치로 보인다.
한국어 번역은 후발 경쟁 업체 파파고 쪽이 더 나은 편이다. 파파고는 경어체 버전, 평어체 버전을 선택해서 들을 수 있지만 현재까지 구글 번역에서 한국어 번역은 경어체나 평어체를 선택할 수 없다. 하지만 웹페이지 번역의 경우 파파고는 앱을 강요하고있다.
유튜버 Lapatata가 구글 번역을 이용한 'In Different Languages Meme' 영상 시리즈를 만들어서 유튜브 내에서 널리 유행시켰다.
한국어로 문재앙을 입력하면 영어로 Moon Jae-in이, 문재앙 대통령을 입력하면 President Moon Jae-in이 출력되어서 문제가 된 적이 있었다.#
음성 tts를 지원해주는 덕분에 글을 읽기 귀찮은 사람은 글을 드래그 해서 복사 붙여넣기 한뒤 구글번역기 목소리로 들으면 좋다.
통합 번역 API를 공개한 모양인지 Kiwi Browser나 Opera와 같은 크로뮴 프로젝트 기반 브라우저도 통합 번역을 지원한다.[74]
라틴어 및 이탈리아어 음성은 Wall Su의 김근육 시리즈 등장인물 촉촉이의 음성 소스로 사용됐었지만 라틴어와 이탈리아어의 음성이 어색하게 바뀐 탓에 더 이상 사용하지 않게 되었다.
구글 번역 사이트인 translae.google.com에서 나오는 결과물과 모바일 앱 또는 이곳에 나오는 구글 번역기의 결과물이 다른 경우가 자주 발생한다. 단순히 말투나 반말/존대말이 다른 경우도 있고 전자는 오역되는데 후자는 제대로 번역될 때도 있다.[75]
[1] 기사에 따르면 당시 구글에서 라이선스를 받아 놓았던 번역기인 듯하다.[2] 번역하자면 '잘린 날생선 신발들이 소원을 빈다. 구글 대파!'이다.[3] 이건 뭐 왈도체보다도 심하다--[4] 현재에는 콩글리시인 파이팅이 그대로 Fighting으로 번역되는 것을 제외하면 정상적으로 영어로 번역된다. Please reply. Google Fighting! ‘파이팅’은 이른바 한류유행어라 하여, 외국 한류팬들이 한국어 영상물을 번역할 때도 그냥 'Fighting'으로 번역하며, Google 번역도 그걸 반영한 듯하다.[대체품] 구글 웹사이트 번역의 대체제로 , 얀덱스 웹사이트 번역을 쓰면 된다.( 파파고 웹사이트 번역은 2024년 9월 1일에 서비스가 종료되었다.)[6] 참고로 이름 비슷한 방송통신위원회에 민원 넣으면 특별한 경우가 아닌 이상 방심위로 민원을 이관시킨다. 즉, 국민신문고로는 특별한 경우가 아니면 방통위 측 입장을 들을 수 없다.[7] (상략) 심의위원회의 설립, 운영, 직무에 관한 내용을 종합하면, 심의위원회를 공권력 행사의 주체인 국가행정기관이라 인정할 수 있다. (헌재 2012. 2. 23. 2011헌가13, 판례집 24-1상, 25, 33-33)[8] 가나 가족(부족) 언어[9] 정확히는 보크몰이다.[10] 자위 문자, 로마자[11] 정확히는 서프리지아어.[12] 현대 바티칸에서 사용되는 이탈리아어 기반의 교회 라틴어로 발음한다.[13] 라틴어와 목소리가 같으며 라틴어는 현대 이탈리아어와 발음이 비슷한 교회 라틴어로 발음한다. 특유의 느끼한 남자 목소리가 특징으로 김근육 시리즈에 나오는 촉촉이의 목소리다.[14] 텍스트 자료를 데이터베이스화한 시스템(예시)[15] 따라서 원문의 문법 요소에 대한 분석은 고려하지 않는다.[16] 검색결과(표본)가 많아야 통계적으로 정확성이 높아진다.[17] 그러나 반대 방향으로는 오역이 나온다.[18] 대표적으로 하츠네명박. 그외에도 한국어 번역에서 야민정음이 반영됐다거나의 사례로 볼때 한국의 디시인사이드나 일본의 5ch에서 활동하는 네티즌 혹은 그 영향을 받은 불특정 다수의 '인터넷 주민'들이 개입한 걸로 추정된다. 또한 다른 외국에서도 마찬가지인게 한가지 사례를 들면 어떤 익명이 지구 평면론자들을 풍자하기 위해 '나는 지구 평면론자다'(I am a flat-earther)라는 뜻의 영어를 불어로 번역하면 '나는 미친놈이다'(je suis un fou)라는 뜻의 불어로 나오도록 제안한 사례가 있다...[19] 이 기사에서는 언급되지 않으나, AFP를 비롯한 외신에서는 악성 제안의 가능성을 문제시 삼고 있다. 만일 악성 제안이 있었다면, 중국공산당에서 직접 요청했을 가능성이 높다. 실제로 트위터나 페이스북에서는 2019년 홍콩 민주화 운동 이후 매달 한 번씩 중국 공산당원들의 계정을 잡아내는데, 한 번에 최소 20만 개씩 계정 정지를 해야하는 수준이다. 트위터나 페이스북에서 공산당 계정을 정지시킬 때마다 "우리는 정당하게 트위터/페이스북 활동 하는데 왜 니들이 우리 계정을 정지하냐?"라며 겅솽 중국 외교부 대변인이 항의한다. 트위터나 페이스북의 사례를 봤을 때, 중국 공산당에서 보유한 구글 지메일 계정은 몇 개나 있을 지 모른다. 이런 각종 공산당 계정을 통해 한 번에 수백만 번씩 악성 제안을 넣는 것으로 추정된다.[20] 중국어로 加油가 힘내라는 뜻이다. 한자 각각의 뜻을 옮기면 기름을 더하다라는 뜻이 된다.[21] 심지어 이것은 커뮤니티 공식 인증을 받았다.[22] 다만 기본적으로 미국 영어를 기준으로 번역하기에 이건 딱히 번역기 성능의 문제라고 보기는 어렵다.[23] 속어로 망치다라는/망가졌다라는 뜻도 있다. "This thing is fucked up"은 이거 망가졌다라던가 아니면 이 상황이 막장이 됐다라는 뜻.[24] 2020.02.25 기준[25] 더 많은 번역 보기를 누르면 '조심하세요!'가 나온다. 정작 밑에 단어의 뜻은 '조심하세요'라고 뜬다[26] 2018.8.23. 기준[27] 그러나 Watch your step! → "조심해!"로 번역된다.[28] 2019-02-27 기준[29] 인증 배지를 받았다[30] 원래 뜻은 알몸이다.[31] 2019.03.09 기준[32] 2018.5.26 기준[33] 그냥 Copy that만 입력하면 "알겠다"로 정상적으로 나오지만, 뒤에 문장을 더 추가하면 오역이 된다.[34] 올바른 번역 : 아무리 강조해도 지나치지 않아[35] 2021.3.30 기준[36] 물음표, 구두점, 쉼표를 다 찍어봐도 번역 상태는 똑같다.[37] 2023년 8월 30일 기준[38] 대신 마침표를 찍으면 그나마 정상적인 번역이 나온다. 느낌표를 한 번에서 네 번 찍으면 읭읭!이 나온다. 그리고 느낌표를 다섯번 찍으면 낑낑낑낑낑낑낑낑낑!!!!!이 나오며, 쉼표를 찍으면 으아아아아아아아아아아아아아아아아가 나오고, 물음표를 찍으면 ㅋ ㅋ ㅋ ㅋ ㅋ ㅋ 가 나온다.[39] 이 역시 마침표, 쉼표, 물음표, 느낌표를 아무리 많이 찍어봐도 번역 결과가 똑같다. 다만 일부 문장에 한해, 이 문장이 문장 사이에 든 경우는 정상적으로 번역이 된다. 예를 들어 Hey, I told you so! 는 '야 내가 그렇게 말했잖아!' 로 번역된다.[40] 다만 Get some rest ^^ 같은 경우는 "좀 쉬세요"뒤에 기호가 붙은 형태로 정상적으로 번역된다.[41] 정식 영어 번역판에서는 "Abhorrence of my own kind"로 번역됐다.[42] 심지어 이걸 "Google 번역 커뮤니티에서 이 번역문을 확인했습니다."란다. '백조 두 마리'로 치면 'Two swan lived long ago'로 제대로 나온다. 이 오역이 유명해지면서 누군가 장난으로 검수해 놓은 것으로 보인다.[43] 볼드가 적용된 문장이 정확한 번역이다![44] 아마도 `고'를 늙은으로,'자' 를 남자로 번역한 듯 하다.[45] 느낌표를 떼면 i'm old라고 나온다.[46] 느낌표를 떼면 I'm a eunuch로 나온다.[47] 느낌표를 추가하면 그나마 정상적인 번역이 나온다. (Hey, doctor!)[48] 과거엔 Mr. bankrupt였다.[49] 기둥 모양을 뜻하는 한자어 ‘주상’과, 양전하 음전하의 ‘전하’로 인식했고, ‘납시오’는 옛말이어서 인식을 못 했는지 음차했다.[50] 2017.03.08. 기준[51] 아무래도 '풍'을 'wind'로 해석하는 것 같다.[52] 2017.10.21. 기준[53] 사용자 검수 표시가 붙은 번역이다.[54] 해외 국내를 포함한 모든 사전에서 "전사" 또는 "무사" 는 Warrior 로 통용되고 있다.[55] 영어로 번역해도 Pig scaffolding으로 나온다.[56] 너구리와 라쿤은 다른 종이다[57] 예전엔 '糞'으로 잘 번역되다가 어느 순간부터 이렇게 번역된다. 영어로 헛소리라는 뜻을 가진 속어 bullshit의 중역으로 여겨짐. 다만 정작 Bullshit은 일본어로 でたらめ로 번역되며 다른 번역으로 진짜 '똥'이라는 뜻의 うんこ가 표시된다.[58] 원래 ハレー彗星이 맞으나 '핼리'를 인식하며 저런 번역이 나온 것으로 보인다.[59] 한자로 된 숫자를 번역하면 숫자가 바뀌는 경우가 흔하다.[60] 영어 bullshit의 덜떨어진 중역 결과로 보여진다.[61] 프랑스어→영어 번역은 거의 정확하게 번역하는 편이지만 영어→프랑스어 번역은 여전히 갈 길이 멀다.[62] 이들 중 다른 외국어→영어는 번역이 괜찮은데 영어→다른 외국어의 번역에 문제가 있는 경우가 많다.[63] 핀란드어, 에스토니아어, 헝가리어 등은 우랄 계통의 언어로, 인도유럽어족이 아니다.[64] 신경망 번역이 적용된 건지 이 문장은 정확한 번역을 보여준다.[65] 쉼표 뒤가 해석이 되지 않았지만 신경망 번역 적용 이후 상당히 많이 좋아졌다.[66] 다른 제안이다.[67] 보통 두번째 문장이 접속사로 시작될 경우.[68] 몇몇 사람들에겐 불편하다고 여기지는 기능이었다.[69] 자동사로 쓰여서 땅의 가격이 올랐다는 표현이나 감사합니다 등으로 나온다.[70] 다만 동생의 성별에 따라 표현이 달라지는 형-오빠, 누나-언니 구분은 일본어와 중국어도 크게 발달하지 못했다.[71] 동아시아의 언어들[72] 한국에서 기독교의 신을 고유어인 하느님, 하나님으로 번역하듯이 일본어에서도 기독교의 신을 해당 한자로 번역하는데, 문제는 문맥을 따지지 않고 일괄적으로 번역한다는 것.[73] 사용하는 방법은 메모장에 미리 쓸 단어/문장을 적어, 그걸 복붙하면 된다.[74] 이전에는 웹페이지 번역을 경유해야했다.[75] 예를 들어서
The MP3's bitrate is poor.
를 한글로 번역하면 후자는 MP3의 비트레이트가 좋지 않습니다.
라고 제대로 번역되는데 전자는 "MP3의 비트 전송률은 가난합니다."로 번역된다. 또한 아이 나비라고 치면 전자는 내비게이션으로 인식해서 I -Navi라고 뜨고 후자는 직역해서 child butterfly로 나오기도 한다. 아이 나방은 후자는 Child Moth라고 제대로 번역되는데 전자는 Ai Ms. Room라고 나온다.