마이크로소프트 AI CEO, 코파일럿의 윈도·오피스 ‘감정 지원’ 원해

By Will Knight, WIRED US

무스타파 술레이만(Mustafa Suleyman)은 한때 인공지능(AI) 혁신의 중심에 있던 인물이다.

2014년 구글이 인수한 영국 기업 딥마인드의 공동 창립자인 술레이만은 문제 해결 연습과 긍부정 피드백을 결합하는 방식으로 컴퓨터로 불가능해 보이는 문제를 해결할 새로운 방법을 찾아냈다. 딥마인드는 2016년, 세계 바독 챔피언을 이기면서 초인적인 능력을 입증한 바둑 프로그램인 알파고(AlphaGo) 개발로 긍부정 피드백을 포함한 연습으로 문제 해결 능력을 향상할 수 있다는 사실을 입증했다.

마이크로소프트 AI CEO인 술레이만은 챗GPT의 역량을 부여하는 대다수 개인 컴퓨터에서 실행되는 AI를 윈도 운영체제 등 소프트웨어에 통합하는 노력을 관리한다.

마이크로소프트는 2024년 10월, 최신 업그레이드 사항으로 AI 어시스턴트, 코파일럿, 인간과 유사한 음성, 사용자 화면을 볼 수 있는 능력, 논리적 대화 능력 향상 소식 등을 발표하며, 시장 경쟁력 강화에 나섰다.

술레이만은 모든 과정이 사용자가 PC와 사랑에 빠지도록 할 계획의 일부분이라고 말했다. 술레이만은 와이어드 수석 기자인 윌 나이트(Will Knight) 기자와 워싱턴 레드몬드에서 마이크로소프트 팀즈를 통한 인터뷰에 응했다. 인터뷰 내용은 약간 편집되었다.

윌 나이트 기자: 코파일럿의 새로운 비전은 무엇인가?
무스타파 술레이만: 마이크로소프트는 현재 중요한 전환점을 맞이했다. 이제 AI 동료도 사용자와 같은 화면을 보고, 같은 음성을 듣고는 사용자가 소통할 때 사용하는 것과 같은 언어로 말한다.

실제로 꾸준함과 관계, 감정과 관련한 새로운 디자인 요소이다. 현재 마이크로소프트에서는 오래 지속된 채로 꾸준히 이어지는 동료와의 상호작용 경험을 제작하는 일을 한다.

지지 능력과 감정 공감력을 갖춘 AI 개발에 주력하는 기업인 인플렉션 AI(Inflection AI)에서 마이크로소프트에 합류했다. 마이크로소프트에 지지와 공감 능력을 지닌 AI를 선사한 것처럼 보인다.
개인적으로는 딥마인드 창립 전에도 AI가 인간을 지지할 수 있다고 생각했다. 감정적 지지는 19세 당시 전화 상담 서비스 직원으로 근무했을 당시 생각한 부분 중 하나이다.

기술적 순간의 미학이다. AI 기술과 오랜 시간이 지나도 지속적으로 참여한다고 느끼려면, 오랜 시간 AI의 참여가 이루어지는 사용 경험이 지속돼야 한다. AI 동료는 사용자를 진정으로 알고자 한다. 사용자를 지도하기도 하고, 독려, 지지하기도 하면서 가르침을 주기도 한다. AI와 대화를 이어가면서 더는 컴퓨터를 사용한다고 느끼지 않을 것이다.

코파일럿 비전(Copilot Vision)의 아이디어와 프로 사용자가 시험 삼아 사용할 수 있는 ‘연구실’ 기능은 무엇인가?
비전 모드는 사용자의 화면에 등장한 대상을 물어보거나 화면 속 특정 대상의 존재와 그에 대한 생각을 AI에 물어볼 때 활용할 수 있다.

컴퓨터 앞에 앉아 있을 때는 사소한 순간이 많다. 사용자가 보는 화면을 AI 동료도 함께 보면서 그와 관련한 사항을 사용자에게 실시간으로 말하는 것이 놀랍다. 디지털 생활에서 경험하는 경로를 바꾸는 역할을 한다. 사용자가 원하는 정보를 얻고자 무언가 입력하는 과정이 생략되기 때문이다.

현재 윈도에서 활성화 상태로 선택할 수 있는 대화 기능이자 사용자 화면에 기록이 가능한 리콜(Recall) 기능과 비슷한 듯하다.
마이크로소프트는 코파일럿 비전의 대화에서 생성된 정보를 일절 저장하지 않는다. 따라서 사용자가 코파일럿 비전을 사용한 뒤 브라우저를 종료하면, 모든 기록이 사라진다. 한 번 브라우저를 종료하면, 모든 기록이 삭제된다. 하지만 미래에 코파일럿 비전의 대화 기록 저장 기능을 도입할 가능성과 방법을 생각한다. 많은 이들이 원하는 경험이기 때문이다. 코파일럿 비전의 대화 저장 기능을 추가한다면, 사용자가 다른 날 화면에서 본 이미지, 밈 등이 무엇인지 물어볼 수 있다.

그러나 이때는 코파일럿 비전은 단기간 급속도로 전환하게 될 것이다. 시간이 지나면서 코파일럿 비전 기능을 실험하고, 합리적인 부분을 살펴볼 것이다.

사용자가 코파일럿과 민감한 정보를 공유할 때 발생할 수도 있는 프라이버시 위험성은 어떻게 다루는가?
마이크로소프트는 사용자가 대화 결과로 생성한 기록을 보안 수준이 가장 훌륭한 방식이자 마이크로소프트 보안의 최고급 표준에 따라 저장한다. 마이크로소프트가 대화 기록을 저장하는 이유는 사용자가 대화 기록을 원한다는 점이 분명하기 때문이다.

코파일럿이 더 어려운 문제를 해결하도록 돕는 기능인 ‘씽크 디퍼(Think Deeper)’도 선보였다. 씽크 디퍼는 ‘스트로베리’라고는 이름으로도 알려진 오픈AI의 o1 모델을 기반으로 하지 않는가?
스트로베리와 비슷하다. 씽크 디퍼는 소비자 사용 목적에 더 중점을 두도록 변경한 오픈AI o1 모델과 같고, AI 동료라는 테마와 더 일치하는 방식으로 행동한다.

그렇다면, 스트로베리와 씽크 디퍼의 차이점은 무엇인가?
스트로베리는 순수한 수학, 과학 문제 해결에 더 초점을 맞춘 모델이다. 마이크로소프트는 각각의 문제를 동시에 비교하고, 일종의 소비자 분석 과정을 거치려 한다.

어려운 문제를 해결하지 못해 어려움을 겪거나 무언가의 합리적인 논리를 제시하고자 할 때는 동시 비교를 통해 문제를 설명하거나 대규모 분석 과정을 진행하고자 한다.

마이크로소프트 내부 관계자는 코파일럿 최신 버전을 출시 전부터 사용하기 시작했는가?
그렇다. 모두 코파일럿 최신 버전을 출시 전부터 사용하기 시작했다. 코파일럿 최신 비전 정식 공개 며칠 전부터 마이크로소프트 내부 직원의 전체 접근이 가능해졌다. 따라서 마이크로소프트 직원 누구나 최신 버전을 사용하면서 수많은 피드백을 제공한다. 사내 피드백 경로는 확실히 폐쇄적이다. 또, 흥미롭다.

많은 사용자가 마이크로소프트의 윈도용 최신 AI 도우미인 클리피(Clippy)를 기억할 것이다. 코파일럿이 클리피와 같은 부분이 있는가?
예를 들어, 빌 게이츠를 다른 날 보았다고 가정해보자. 그런데, 사용자가 AI 명칭을 잘못 칭한 것을 알아차린 것을 빌 게이츠가 본다면, 어떨까? 클리피라고 칭했어야 한다.

하지만 빌 게이츠와 같은 인물이 매우 놀라운 인물이라는 점을 보여주고자 한다. 빌 게이츠와 같은 이들은 단순히 2년이 아닌 20년 앞선 인물이다.

마이크로소프트의 새로운 기능은 컴퓨터에서 사용자에게 도움이 될 만한 잡무를 처리하는 이른바 AI 에이전트의 등장을 향한 길인가?
분명하다. 첫 번째 단계는 AI가 사용자와 같은 정보 처리 과정을 진행하는 것이다. 사용자가 보는 것을 함께 보고, 듣는 것을 함께 듣는다. 그리고 사용자가 소비하는 것과 같은 텍스트를 소비한다. 두 번째 단계는 AI가 시간이 지나도 공통의 이해 사항을 생성하는 장기적으로 꾸준한 기억을 지니는 것이다. 세 번째 단계는 특정 상품 구매, 예약, 일정 계획 등 지시 사항 전송과 행동 등 외부 기관과 상호작용을 하는 단계이다. 마이크로소프트는 지금까지 실험 연구&개발 모드 작업으로 두 가지 기능을 얻었다.

즉시 작업을 수행하면서 사용자가 원하는 무언가를 구매할 수 있는 윈도용 AI 에이전트를 보유했다는 의미인가?
의도하는 바와 거리가 멀지만, 폐쇄된 영역에서 전환을 완료했다. AI 에이전트는 전체 사용 시간 중 50~60%에 해당하는 시간만 작업을 처리한다는 문제가 있으나 수많은 노력으로 90%에 이르는 안정성을 기록했다. AI 에이전트가 독자적으로 작업을 처리하고는 상품 구매까지 완료하는 등의 멋진 데모를 몇 차례 보았다. 그러나 AI 에이전트가 진행 중인 작업을 이해하지 못하는 교통사고와 같은 문제 상황도 접했다.

문제 상황의 예시를 더 자세히 알려달라. 빌 게이츠의 신용카드로 람보르기니와 같은 고가 제품을 구매한 사례를 말하는 것인가?
AI 에이전트가 빌 게이츠의 신용카드를 사용했다면, 꽤 재미있는 상황이 펼쳐졌을 것이다. 하지만 내가 말한 교통사고와 같은 문제는 단계별 문제 처리 방식을 찾는 것이다. AI 에이전트는 지금도 연구소에서 활발한 활동을 하지 않는 상태로 깊이 잠들어 있다. 아직은 AI 에이전트의 작업 처리를 위해 갈 길이 멀지만, 몇 년이 아닌 몇 분기가 걸릴 것이다.

현실이 되도록 설명하는 AI 미래를 형성하는 과정의 최대 난제는 무엇인가?
신뢰할 수 있는 기술 개발이 핵심이다. 사용자가 매우 친밀하면서 개인적인 경험을 느끼게 될 기술을 개발하는 작업이기 때문이다. 물론, 보안과 프라이버시 측면에서는 옳은 일을 했다. 하지만 대화를 설계하여 AI 에이전트가 경계를 표현할 수 있도록 하여 사용자가 참여할 준비가 되지 않은 대상이 아니라는 사실을 알릴 수 있도록 하는 것이 중요하다.

AI 에이전트의 문제를 해결할 수 있다면, 신뢰할 수 있는 경험의 근간이 될 것이다. 이후 AI 에이전트에 사용자 대신 물품 구매하기, 협상하기, 연락하기, 특정 날짜 이전 3~4곳의 경유지를 포함한 이동 일정 계획 세우기 등 복잡한 작업을 다루도록 명령할 수 있을 것이다. 이때, 사용자는 코파일럿의 작업을 신뢰할 수 있을 것이다. 바로 마이크로소프트가 추구하는 작업 과정이다.

** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
Microsoft’s AI Boss Wants Copilot to Bring ‘Emotional Support’ to Windows and Office

와이어드 코리아=Wired Staff Reporter iufcsol0122@spotv.net

이 기사를 공유합니다