By BLAKE SNOW, WIRED US
오늘날 언어 번역 앱은 자율주행차와 같다. 매우 유용하면서도 유망한 데다가 완벽에 가까운 수준으로 개발되었으며, 100% 기계가 성능을 부여한다. 심지어 번역 기술이 존재한다는 사실 자체도 놀랍다.
그런데도 기계 번역은 어색하지 않더라도 간혹 투박하다.
최근, 필자가 1년 전 러시아에서 이민 온 이웃 안드레(Andre)와 대화한 순간을 떠올릴 수 있다. 영어를 거의 구사하지 못하는 안드레는 10년 전 출시되어 가장 인기가 높은 다국어 통, 번역 앱인 구글 번역에만 거의 전적으로 의존한 채로 아메리칸드림을 실현하고 있다.
안드레와 필자는 안드레의 스마트폰을 이용하여 안드레의 출신 배경과 사고, 서로 도움을 줄 방법, 안드레가 바라는바 등 다양한 주제로 놀라울 정도로 깊이 있는 대화를 나눌 수 있다. 그러나 대화 도중 한 번 이상 간혹 안드레가 표현하고자 하는 바를 제대로 전달하지 못한다. 이때는 서로 어색한 침묵 속에서 어깨를 으쓱이며, 미소를 지을 수밖에 없다.
컴퓨터의 지능이 발전하면서 구글, 애플, 마이크로소프트 어려 기업이 안드레와 필자가 겪은 것과 같은 언어 장벽을 완벽하게 허물고자 한다. 그러나 언어 장벽을 제거하려면, 더 빠른 뉴럴 머신러닝(neural machine learning)이 있어야 한다. 필자와 대화를 나눈 어느 한 개발자는 언어 장벽을 완벽하게 허물 수 있을 정도로 빠른 뉴럴 머신러닝이 등장하려면 몇 년이 걸릴 수도 있다고 인정했다.
번역 결과를 확인할 때까지 기다리는 것은 문제가 되지 않는다. 사실, 많은 고객이 오늘날 번역 앱의 번역 능력이 뛰어나다는 사실을 알게 되는 것만으로도 놀란다. 예를 들어, 마이크로소프트 연구원 3명은 마이크로소프트의 실시간 번역 소프트웨어를 이용하여 여러 언어로 진행되는 대화를 이어가도록 한다는 사실을 보여준 적이 있다. 해당 영상은 2017년 공개되었다. 당시 영상을 친구 몇 명에게 공유했을 때 미래를 본 것과 같은 반응을 보였다.
젠데스크(Zendesk), 코세라(Coursera), 하이타치(Hitachi) 등 복수 기업을 대상으로 라이선스를 공급하며, 수상 경력이 있는 기계 번역 서비스인 DeepL 대변인 에리카 리처(Erica Richter)는 “번역을 중심으로 한 기술은 매우 짧은 기간에 활씬 더 높은 수준으로 성공을 거두었다”라며, “그러나 소비자의 인식과 평행하는 방식으로 발전 성과를 거둔 것은 아니다”라고 말했다.
필자도 리처 대변인이 언급한 바와 같이 기계 번역 기술의 발전을 이해하지 못했다. 필자는 20년 가까이 테크 분야 기사를 작성해왔으나 안드레와 운명처럼 마주치고 이 기사 작성을 위해 정보를 검색하기 전까지 구글 번역, 애플 번역(Apple Translate), 마이크로소프트 번역기(Microsoft Translator), 아마존 알렉사 등이 얼마나 능숙하게 번역 작업을 처리하는지 알지 못했다.
올해 기계 번역 기술의 능력은 더 나아지는 추세이다. 구글 대변인은 “구글 번역은 구글이 인공지능(AI)만으로 개발한 제품 중 하나이다. 구글은 2016년, 뉴럴 머신(Neural Machine)을 출시한 뒤 일부 구문이 아닌 문장 전체의 번역 정확도가 최대치로 향상된 것을 발견했다”라고 말했다.
그와 동시에 필자가 이 기사를 작성하기 전 사용한 번역 앱 6개 중 절반은 기본적인 인사도 제대로 번역하지 못했다. 예를 들어, 필자가 시리와 마이크로소프트 번역기를 이용하여 포르투갈어 인사인 “Olá, tudo bem?”을 영어로 번역하도록 지시했을 때 두 가지 앱 모두 “안녕, 잘 지냈니?”라고 정확하게 번역했다. 반면, 구글 번역과 아마존 알렉사는 “안녕, 모두 괜찮지?”, “안녕, 괜찮아?”와 같이 글자 그대로 언어를 변경하여 다소 어색한 표현을 보여주었다. 문장 전체를 엉망으로 번역한 것은 아니다. 하지만 적당한 억양은 일부 청자의 머뭇거림이나 혼란을 유발할 수 있다.
다시 말해, 번역 기술은 인상적이면서도 종종 챗GPT가 대거 생성하는 것처럼 어색한 글을 작성한다. 번역 기술은 효과가 있다. 사용 독려를 할 수 있다. 특정 시기의 품질을 나타낸다. 그러나 구글 번역이 내놓는 결과물은 혼란을 일으키지 않더라도 간혹 인간적이지 않다는 느낌을 준다.
하지만 여전히 세계를 바꾸기 충분하다. 구글 대변인은 “구글은 매일 구글 번역으로 10억 건이 넘는 번역 작업을 처리한다”라며, “최근 들어 카메라 앱으로 보는 대상을 검색하도록 지원하는 구글 렌즈를 이용한 이미지 번역 기능과 같이 맥락 인식 수준을 높일 AI 중심 기능을 추가로 출시했다”라고 전했다.
대화 참여자가 높은 평점을 받은 번역 앱을 사용할 때 서로 마주 보도록 분할 화면이라는 유용한 기능을 지원하는 마이크로소프트의 작업 처리량도 구글과 비슷하다. 마이크로소프트 애저 AI 제품 부사장 마르코 카사라이나(Marco Casalaina)는 “141개 언어 전체에 걸쳐 한 번에 묶어서 실시간으로 처리하고 번역 내용을 문서화하는 기술을 사용하는 기업 수천 곳을 보유했으며, 활성 사용자 수백만 명이 마이크로소프트 번역기의 실시간 대화 기능의 장점을 최대한 활용한다”라고 말했다.
기계 지능 측면에서 기본적으로 언어를 변환하기 위한 툴킷 2개가 존재한다. 그중 하나는 마이크로소프트가 더 민첩하면서도 반복 속도를 높이고, 중요한 사용자 기기에서 규모를 효과적으로 확장하고자 사용하는 오픈소스와 같은 소규모 언어 모델이다. 나머지 하나는 DeepL이 고객 10만 명에게 판매하는 전용 AI 모델과 같은 대규모 언어 모델이다.
일각에서는 대규모 언어 모델의 정확도와 속도가 더 우수하다고 주장한다. 그러나 대규모 언어 모델에는 장, 단점이 모두 존재한다. 대규모 언어 모델의 지원 언어는 총 140개 언어를 지원하는 소규모 언어 모델의 1/4 수준으로 비교적 적고, 오프라인 접근이 불가능하다는 점이 가장 큰 단점이다. 그러나 리처 대변인은 “DeepL은 오프라인 번역을 지원하지 않는다. 최종 사용 기기가 DeepL이 클라우드로 작업할 때와 같은 수준의 품질을 제공하지 않기 때문이다”라고 말했다.
그렇다면, 번역 앱의 다음 단계는 무엇일까? 지금까지 테크 업계 대기업은 어떠한 사항도 말하지 않았다.
입이 무거운 애플의 홍보 담당자는 “애플은 추측하지 않는다”라고 말했다. 애플은 2020년, 시리 기반 번역 앱을 출시했다. 구글 대변인은 “조만간 구글 웹 서비스가 사용자에게 검색 방식을 떠나 이미지 기반 콘텐츠 번역 옵션을 추가로 제공하리라 기대한다”라고 말했다. DeepL도 2024년 말 출시하고자 하는 언어 능력을 대대적으로 개선한 서비스를 개발 중이다.
그러나 필자와 대화한 개발자는 기계 번역 기술의 모든 기능은 AI가 없다면, 불가능하다고 전했다. 카사라이나 부사장은 “AI가 새로운 번역 기능을 꾸준히 개방하면서 앞으로 남아있는 언어 장벽을 제거할 것이다. 번역 기술은 몇 년간 진화할 필요가 있다”라고 언급했다.
필자가 안드레와 대화하던 중 가끔 어색한 침묵을 겪었던 것처럼 오늘날 번역 기술은 대부분 훌륭하지만 가끔 혼란을 일으킬 때가 있다. 기계가 10~20년간 대화를 한 사실을 고려하면, 인간이 2만 년간 해온 일을 처리하는 능력이 향상된 사실을 믿기 어렵다.
어쩌면, 기계가 번역 작업을 처리하는 것이 기적이 아닌 꽤 가까운 일이 될 수 있다.
이해했는가?
** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)
<기사원문>
Translation Tech Is Amazing, Except When It’s Not
오늘날 언어 번역 앱은 자율주행차와 같다. 매우 유용하면서도 유망한 데다가 완벽에 가까운 수준으로 개발되었으며, 100% 기계가 성능을 부여한다. 심지어 번역 기술이 존재한다는 사실 자체도 놀랍다.
그런데도 기계 번역은 어색하지 않더라도 간혹 투박하다.
최근, 필자가 1년 전 러시아에서 이민 온 이웃 안드레(Andre)와 대화한 순간을 떠올릴 수 있다. 영어를 거의 구사하지 못하는 안드레는 10년 전 출시되어 가장 인기가 높은 다국어 통, 번역 앱인 구글 번역에만 거의 전적으로 의존한 채로 아메리칸드림을 실현하고 있다.
안드레와 필자는 안드레의 스마트폰을 이용하여 안드레의 출신 배경과 사고, 서로 도움을 줄 방법, 안드레가 바라는바 등 다양한 주제로 놀라울 정도로 깊이 있는 대화를 나눌 수 있다. 그러나 대화 도중 한 번 이상 간혹 안드레가 표현하고자 하는 바를 제대로 전달하지 못한다. 이때는 서로 어색한 침묵 속에서 어깨를 으쓱이며, 미소를 지을 수밖에 없다.
컴퓨터의 지능이 발전하면서 구글, 애플, 마이크로소프트 어려 기업이 안드레와 필자가 겪은 것과 같은 언어 장벽을 완벽하게 허물고자 한다. 그러나 언어 장벽을 제거하려면, 더 빠른 뉴럴 머신러닝(neural machine learning)이 있어야 한다. 필자와 대화를 나눈 어느 한 개발자는 언어 장벽을 완벽하게 허물 수 있을 정도로 빠른 뉴럴 머신러닝이 등장하려면 몇 년이 걸릴 수도 있다고 인정했다.
번역 결과를 확인할 때까지 기다리는 것은 문제가 되지 않는다. 사실, 많은 고객이 오늘날 번역 앱의 번역 능력이 뛰어나다는 사실을 알게 되는 것만으로도 놀란다. 예를 들어, 마이크로소프트 연구원 3명은 마이크로소프트의 실시간 번역 소프트웨어를 이용하여 여러 언어로 진행되는 대화를 이어가도록 한다는 사실을 보여준 적이 있다. 해당 영상은 2017년 공개되었다. 당시 영상을 친구 몇 명에게 공유했을 때 미래를 본 것과 같은 반응을 보였다.
젠데스크(Zendesk), 코세라(Coursera), 하이타치(Hitachi) 등 복수 기업을 대상으로 라이선스를 공급하며, 수상 경력이 있는 기계 번역 서비스인 DeepL 대변인 에리카 리처(Erica Richter)는 “번역을 중심으로 한 기술은 매우 짧은 기간에 활씬 더 높은 수준으로 성공을 거두었다”라며, “그러나 소비자의 인식과 평행하는 방식으로 발전 성과를 거둔 것은 아니다”라고 말했다.
필자도 리처 대변인이 언급한 바와 같이 기계 번역 기술의 발전을 이해하지 못했다. 필자는 20년 가까이 테크 분야 기사를 작성해왔으나 안드레와 운명처럼 마주치고 이 기사 작성을 위해 정보를 검색하기 전까지 구글 번역, 애플 번역(Apple Translate), 마이크로소프트 번역기(Microsoft Translator), 아마존 알렉사 등이 얼마나 능숙하게 번역 작업을 처리하는지 알지 못했다.
올해 기계 번역 기술의 능력은 더 나아지는 추세이다. 구글 대변인은 “구글 번역은 구글이 인공지능(AI)만으로 개발한 제품 중 하나이다. 구글은 2016년, 뉴럴 머신(Neural Machine)을 출시한 뒤 일부 구문이 아닌 문장 전체의 번역 정확도가 최대치로 향상된 것을 발견했다”라고 말했다.
그와 동시에 필자가 이 기사를 작성하기 전 사용한 번역 앱 6개 중 절반은 기본적인 인사도 제대로 번역하지 못했다. 예를 들어, 필자가 시리와 마이크로소프트 번역기를 이용하여 포르투갈어 인사인 “Olá, tudo bem?”을 영어로 번역하도록 지시했을 때 두 가지 앱 모두 “안녕, 잘 지냈니?”라고 정확하게 번역했다. 반면, 구글 번역과 아마존 알렉사는 “안녕, 모두 괜찮지?”, “안녕, 괜찮아?”와 같이 글자 그대로 언어를 변경하여 다소 어색한 표현을 보여주었다. 문장 전체를 엉망으로 번역한 것은 아니다. 하지만 적당한 억양은 일부 청자의 머뭇거림이나 혼란을 유발할 수 있다.
다시 말해, 번역 기술은 인상적이면서도 종종 챗GPT가 대거 생성하는 것처럼 어색한 글을 작성한다. 번역 기술은 효과가 있다. 사용 독려를 할 수 있다. 특정 시기의 품질을 나타낸다. 그러나 구글 번역이 내놓는 결과물은 혼란을 일으키지 않더라도 간혹 인간적이지 않다는 느낌을 준다.
하지만 여전히 세계를 바꾸기 충분하다. 구글 대변인은 “구글은 매일 구글 번역으로 10억 건이 넘는 번역 작업을 처리한다”라며, “최근 들어 카메라 앱으로 보는 대상을 검색하도록 지원하는 구글 렌즈를 이용한 이미지 번역 기능과 같이 맥락 인식 수준을 높일 AI 중심 기능을 추가로 출시했다”라고 전했다.
대화 참여자가 높은 평점을 받은 번역 앱을 사용할 때 서로 마주 보도록 분할 화면이라는 유용한 기능을 지원하는 마이크로소프트의 작업 처리량도 구글과 비슷하다. 마이크로소프트 애저 AI 제품 부사장 마르코 카사라이나(Marco Casalaina)는 “141개 언어 전체에 걸쳐 한 번에 묶어서 실시간으로 처리하고 번역 내용을 문서화하는 기술을 사용하는 기업 수천 곳을 보유했으며, 활성 사용자 수백만 명이 마이크로소프트 번역기의 실시간 대화 기능의 장점을 최대한 활용한다”라고 말했다.
기계 지능 측면에서 기본적으로 언어를 변환하기 위한 툴킷 2개가 존재한다. 그중 하나는 마이크로소프트가 더 민첩하면서도 반복 속도를 높이고, 중요한 사용자 기기에서 규모를 효과적으로 확장하고자 사용하는 오픈소스와 같은 소규모 언어 모델이다. 나머지 하나는 DeepL이 고객 10만 명에게 판매하는 전용 AI 모델과 같은 대규모 언어 모델이다.
일각에서는 대규모 언어 모델의 정확도와 속도가 더 우수하다고 주장한다. 그러나 대규모 언어 모델에는 장, 단점이 모두 존재한다. 대규모 언어 모델의 지원 언어는 총 140개 언어를 지원하는 소규모 언어 모델의 1/4 수준으로 비교적 적고, 오프라인 접근이 불가능하다는 점이 가장 큰 단점이다. 그러나 리처 대변인은 “DeepL은 오프라인 번역을 지원하지 않는다. 최종 사용 기기가 DeepL이 클라우드로 작업할 때와 같은 수준의 품질을 제공하지 않기 때문이다”라고 말했다.
그렇다면, 번역 앱의 다음 단계는 무엇일까? 지금까지 테크 업계 대기업은 어떠한 사항도 말하지 않았다.
입이 무거운 애플의 홍보 담당자는 “애플은 추측하지 않는다”라고 말했다. 애플은 2020년, 시리 기반 번역 앱을 출시했다. 구글 대변인은 “조만간 구글 웹 서비스가 사용자에게 검색 방식을 떠나 이미지 기반 콘텐츠 번역 옵션을 추가로 제공하리라 기대한다”라고 말했다. DeepL도 2024년 말 출시하고자 하는 언어 능력을 대대적으로 개선한 서비스를 개발 중이다.
그러나 필자와 대화한 개발자는 기계 번역 기술의 모든 기능은 AI가 없다면, 불가능하다고 전했다. 카사라이나 부사장은 “AI가 새로운 번역 기능을 꾸준히 개방하면서 앞으로 남아있는 언어 장벽을 제거할 것이다. 번역 기술은 몇 년간 진화할 필요가 있다”라고 언급했다.
필자가 안드레와 대화하던 중 가끔 어색한 침묵을 겪었던 것처럼 오늘날 번역 기술은 대부분 훌륭하지만 가끔 혼란을 일으킬 때가 있다. 기계가 10~20년간 대화를 한 사실을 고려하면, 인간이 2만 년간 해온 일을 처리하는 능력이 향상된 사실을 믿기 어렵다.
어쩌면, 기계가 번역 작업을 처리하는 것이 기적이 아닌 꽤 가까운 일이 될 수 있다.
이해했는가?
** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)
<기사원문>
Translation Tech Is Amazing, Except When It’s Not
저작권자 © WIRED Korea 무단전재 및 재배포 금지
저작권자 © WIRED Korea 무단전재 및 재배포 금지
이 기사를 공유합니다