By HENRY AJDER and NINA SCHICK, WIRED UK
지난 5년간 인공지능(AI)은 보편적으로 ‘딥페이크(deepfake)’라고 불리는 위조된 인간의 얼굴과 음성 생성 능력이 크게 발전했다. 초기 딥페이크 생성 과정에는 뛰어난 성능을 자랑하는 컴퓨터와 기술적 전문 지식이 필요했다. 그러나 현재, 딥페이크 제작은 특별 능력이나 컴퓨터 전력 없이 갈수록 간단한 인터페이스와 기계를 거치지 않는 처리 과정과 함께 갈수록 누구나 접근할 수 있게 되었다.
누구나 접근 가능하다는 특성 때문에 누구나 스마트폰으로 딥페이크를 제작할 수 있는 딥페이크 앱이 급격히 증가했다. 일부 딥페이크 앱은 사용자의 얼굴을 유명인의 얼굴로 완벽하게 바꾼다. 또, 영상 속 인물의 얼굴 움직임을 다르게 제작하기도 한다. 지기(Jiggy)라는 앱은 한 인물의 신체 사진 한 장만 가지고 다른 춤을 추는 GIF 파일을 생성하기도 한다.
다양한 앱으로 제작된 딥페이크 사진 혹은 영상은 매우 현실적이지 않지만, 더 첨단화된 기술이 실존하지 않는 인물의 실제와 같은 사진 이미지를 만들었다. 제이지의 목소리를 한 랩하는 셰익스피어의 영상, 저스트 잇(Just Eat) 광고 속 스눕독의 입 움직임을 맞추는 것 등이 딥페이크를 사용한 사례에 해당한다.
현실적인 딥페이크 이미지 혹은 영상을 제작할 때, 여전히 상당한 전문 기술과 하드웨어가 필요하다. 사우스 파크(South Park)의 제작자인 맷 스톤(Matt Stone)과 트레이 파커(Trey Parker)는 딥페이크 기술 전문가와 VFX 전문가 20명을 고용해, 새로운 풍자적 성격의 딥페이크 쇼인 ‘새시 저스티스(Sassy Justice)’를 제작한다. 새시 저스티스는 도널드 트럼프의 얼굴을 한 어느 한 작은 마을의 리포터가 앨 고어, 이방카 트럼프, 마이클 케인 등 딥페이크로 제작된 유명인사를 마주치는 내용을 담았다. 스톤과 파커는 초기의 15분짜리 영상을 제작하는 데 천문학적인 비용을 투자했다고 밝혔다.
그러나 기술 전문가와 금전적 자원은 더 오랫동안 현실적인 딥페이크 영상을 생성하는 데 장벽이 되지 않는다. 많은 개발자가 차세대 소셜 콘텐츠를 정의할 딥페이크의 잠재적 능력을 최대한 이용하기 위한 경쟁을 펼치기 때문이다. 딥페이크의 잠재적 능력 경쟁을 이끄는 기업 중 하나는 우크라이나 기업 리페이스(Reface)이다. 리페이스의 안면 변환 앱은 2020년 8월 기준 누적 다운로드 횟수 2,000만 회를 돌파하며 100개국에서 애플과 안드로이드 스토어 모두 인기 앱 1위를 차지했다. 리페이스 CEO 로만 모길니(Roman Mogylnyi)는 최근, 미국 테크 매체 테크크런치와의 인터뷰에서 앱의 딥페이크 품질 향상과 인물의 신체를 전부 변환하기 위한 앱 업그레이드를 기다리고 있다고 밝혔다. 모길니는 딥페이크 앱의 미래가 많은 사람이 일생에서 다른 삶을 살 기회를 주는 맞춤형 플랫폼이 되리라 생각한다. 하지만, 첨단화된 딥페이크 앱의 상업화는 앱 악용 문제와 관련된 우려를 제기한다.
얼핏 보아도 딥페이크 기술의 악용 사례는 이미 가시적으로 드러났다. 어느 한 논문의 공동 저자는 최근 텔레그램 앱에서 딥페이크 포르노 봇을 발견했다. 딥페이크 포르노 봇은 사용자가 딥페이크로 제작된 여성의 나체 이미지를 두고 의상을 착용한 여성의 옷을 벗기도록 한다. 총 10만 명이 넘는 여성과 미성년자의 딥페이크 이미지가 참가자 수 10만 명이 넘는 것으로 집계되는 텔레그램 채널에 공유됐다.
2020년 4월, 딥페이크 앱이 정치 관련 거짓 정보와 온라인상에 대중을 속일 수 있는 콘텐츠 유포를 촉발한다는 우려도 제기됐다. 당시 도널드 트럼프 전 대통령이 조잡하게 조작된 혀를 늘어뜨리면서 눈썹을 움직이는 모습이 담긴 조 바이든 현 대통령의 딥페이크 영상을 리트윗하자 우려가 더 심각해졌다. 당시 트럼프 전 대통령이 리트윗한 영상은 현실성이 없는 영상이지만, 향후 이와 비슷한 일이 더 많이 발생할 것이라는 점이 타당하다. 두 가지 사례 모두 딥페이크 앱이 대규모로 유해한 가짜 콘텐츠를 생성하고는 온라인에 이미지가 게재된 모든 이에게 위협을 가할 것이라는 우려스러운 미래를 나타낸다.
수많은 딥페이크 앱이 거짓 정보 혹은 유해 콘텐츠를 유포할 수 있다는 우려가 계속 이어지거나 제한될 수 있다. 사용자는 사전 승인된 영상 혹은 TV 쇼 내 지정된 장면에서 인물의 얼굴을 바꿀 수 있다. 그러나 이러한 제약은 종종 의도적인 보안을 위한 선택보다는 기술적 한계의 결과로 나타난다. 하나 이상의 소수 사용자 이미지로 특정 인물의 얼굴을 바꾼 고화질 콘텐츠를 제작하기 위해 딥페이크 앱은 여러 인기 영화 장면으로 생성 모델을 사전 훈련받는다. 영화 샤이닝 속 쌍둥이의 얼굴을 바꾸거나 반지의 제왕에 등장하는 션 빈의 밈을 변형하는 것과 같은 훈련을 받는다. 기술이 갈수록 뛰어난 성능을 자랑하고, 제약이 줄어든 상태에서 사전 훈련을 받자 개발자는 통제되지 않은 접근 방식을 택해 자신의 앱에 사용자가 업로드한 콘텐츠를 생성할 수 있도록 개방하며 경쟁으로 이익을 얻게 되었을 수도 있다.
립싱크와 음성 합성과 같이 잠재적으로 유해할 수 있는 서비스를 제공하는 테크 기업은 자사 제품이 악용되지 않도록 막는 정책을 채택했다. 채택된 정책 중에는 개인적으로 고객을 철저히 검증하는 것과 변경될 수 있는 제품 관련 모든 당사자에게 허가를 받는 것이다. 그러나 딥페이크 앱이 이와 비슷한 규정을 따르는 것을 상상하기 어렵다. 딥페이크 앱 상당수가 신종 딥페이크 기술의 능력을 간절히 원하는 수많은 사용자의 행동에 의존하기 때문이다. 딥페이크 앱이 복잡한 시장에서 사용자의 관심을 받고자 열망하기 때문에 제대로 통제하지 않는 것이 사실상 불가피할 것으로 보인다.
물론, 애플과 구글 모두 속임수를 기반으로 하거나 악의적인 딥페이크 앱을 자사 앱스토어에 배포하지 못하도록 하며, 개발자는 보안 기능을 위해 작업하며 딥페이크 악용 예방 정책 위반 문제를 피하려 한다. 딥페이크 악용을 막기 위한 애플과 구글의 조치에는 앱 전용 딥페이크 감지 툴과 음란물 및 악성 콘텐츠 자동 차단, 앱으로 생성한 딥페이크 콘텐츠 대상 워터마크 삽입 등이 포함됐다.
개발자가 자신이 개발한 딥페이크 앱 악용을 막을 준비가 됐다는 점은 고무적이지만, 보안 기능을 배포하는 데 몇 가지 어려움이 있다. 그중 하나는 개발자가 먼저 보안 기능을 배포할 방식이다. 악성 딥페이크를 막기위한 효과적인 감지 툴 배포 문제에 있어 개발자가 배포할 보안 기능은 SNS 플랫폼과 메시지 앱에서 널리 채택돼야 한다. 그러나 SNS 플랫폼 중, 현재 미디어 업로드 기능에 딥페이크 감지 기능을 구축한 플랫폼은 없다. 또, 왓츠앱이나 텔레그램과 같은 메시지 앱에 감지 기능을 설치하려면 사용자의 대화를 감시해야 한다. 이는 프라이버시에 집중한 현재의 메시지 앱 모델의 대대적인 변화가 필요하다.
또 다른 문제는 보안 조치의 신뢰성이다. 워터마크는 콘텐츠를 보는 이에게 가짜 영상임을 알려줄 수는 있지만, 개발자는 이미지 자체를 보기 불분명하게 만드는 곳에 워터마크를 삽입하는 것을 꺼린다. 즉, 프레임 일부를 잘라내야 한다는 의미이다. 선제 조치로 악성 콘텐츠를 감지하고 차단하는 것도 어렵다는 사실이 입증됐다. 그 근거로 갈수록 발전하고 있는 딥페이크 기술의 변화를 초래할 수 있는 유해할 수도 있는 광범위한 콘텐츠를 언급할 수 있다. 거의 제한적인 딥페이크 기술 악용은 현재 자동화하기 어렵다. 그러나 온라인 공간에서 생성되는 콘텐츠 양을 고려하면, 수동으로 악성 콘텐츠를 제어하는 것은 쉽지 않을 것이다.
위의 모든 문제를 고려했을 때, 딥페이크 앱 악용 문제를 최소화할 수 있는 합리적인 방법은 무엇일까? 한 가지 접근 방식으로 개발자를 위한 앱 안전 프레임워크 제작을 언급할 수 있다. 여기에는 위협 평가나 사용자 인증이 없는 제한된 접근 권한, 피해 완화가 없는 새로운 기능 배포 일시 금지 전략 등이 포함된다. 이와 같은 프레임워크를 앱스토어와 딥페이크 앱의 성공에 비판적인 여러 이해 관계자가 강행한다면, 모든 개발자가 발행 즉시 따를 수 있는 딥페이크 앱의 안전 표준을 만드는 데 도움이 될 것이다.
더 강력한 대응에는 딥페이크 앱이 악용될 가능성을 지니고 있거나 의도적으로 악용할 수 있도록 설계됐을 때, 피해자나 관리 당국이 개발자에게 책임을 묻도록 하는 법안이 포함될 것이다. 개발자에게 책임을 지도록 하는 법안에는 벌금 및 피해 보상 금액 지급, 앱 스토어에서 악용된 앱 삭제, 더 나아가 개발자의 형사 처벌이 포함될 수 있다. 이 모든 접근 방식이 공통적으로 지닌 특성은 앱 접근 권한을 지닌 대상을 제한하면서 앱에서 배포하는 기능을 제한하거나 결국 변경사항 때문에 피해를 일으킨 앱 개발자를 처벌하는 등 통제가 이루어지지 않는 딥페이크 앱을 대상으로 한다는 사실이다.
분명히 딥페이크 앱이 나아가는 데 내재한 마찰이 있다. 바로 딥페이크 앱이 개방되는 동시에 기능이 강화될수록 앱이 일으킬 수 있는 피해를 예방하기 어렵다는 문제이다. 개방성과 안전이라는 균형을 모두 적절하게 유지하는 것은 딥페이크 앱의 성공을 위한 기본적인 요소이다. 만약, 딥페이크 앱이 현재와 같이 계속 통제되지 않는 상태를 유지한다면, 개방성과 안전이라는 균형을 이루기 어려울 것이다.
** 위 기사는 와이어드UK(WIRED.co.uk)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)
<기사원문>
Deepfake apps are here and we can’t let them run amok
지난 5년간 인공지능(AI)은 보편적으로 ‘딥페이크(deepfake)’라고 불리는 위조된 인간의 얼굴과 음성 생성 능력이 크게 발전했다. 초기 딥페이크 생성 과정에는 뛰어난 성능을 자랑하는 컴퓨터와 기술적 전문 지식이 필요했다. 그러나 현재, 딥페이크 제작은 특별 능력이나 컴퓨터 전력 없이 갈수록 간단한 인터페이스와 기계를 거치지 않는 처리 과정과 함께 갈수록 누구나 접근할 수 있게 되었다.
누구나 접근 가능하다는 특성 때문에 누구나 스마트폰으로 딥페이크를 제작할 수 있는 딥페이크 앱이 급격히 증가했다. 일부 딥페이크 앱은 사용자의 얼굴을 유명인의 얼굴로 완벽하게 바꾼다. 또, 영상 속 인물의 얼굴 움직임을 다르게 제작하기도 한다. 지기(Jiggy)라는 앱은 한 인물의 신체 사진 한 장만 가지고 다른 춤을 추는 GIF 파일을 생성하기도 한다.
다양한 앱으로 제작된 딥페이크 사진 혹은 영상은 매우 현실적이지 않지만, 더 첨단화된 기술이 실존하지 않는 인물의 실제와 같은 사진 이미지를 만들었다. 제이지의 목소리를 한 랩하는 셰익스피어의 영상, 저스트 잇(Just Eat) 광고 속 스눕독의 입 움직임을 맞추는 것 등이 딥페이크를 사용한 사례에 해당한다.
현실적인 딥페이크 이미지 혹은 영상을 제작할 때, 여전히 상당한 전문 기술과 하드웨어가 필요하다. 사우스 파크(South Park)의 제작자인 맷 스톤(Matt Stone)과 트레이 파커(Trey Parker)는 딥페이크 기술 전문가와 VFX 전문가 20명을 고용해, 새로운 풍자적 성격의 딥페이크 쇼인 ‘새시 저스티스(Sassy Justice)’를 제작한다. 새시 저스티스는 도널드 트럼프의 얼굴을 한 어느 한 작은 마을의 리포터가 앨 고어, 이방카 트럼프, 마이클 케인 등 딥페이크로 제작된 유명인사를 마주치는 내용을 담았다. 스톤과 파커는 초기의 15분짜리 영상을 제작하는 데 천문학적인 비용을 투자했다고 밝혔다.
그러나 기술 전문가와 금전적 자원은 더 오랫동안 현실적인 딥페이크 영상을 생성하는 데 장벽이 되지 않는다. 많은 개발자가 차세대 소셜 콘텐츠를 정의할 딥페이크의 잠재적 능력을 최대한 이용하기 위한 경쟁을 펼치기 때문이다. 딥페이크의 잠재적 능력 경쟁을 이끄는 기업 중 하나는 우크라이나 기업 리페이스(Reface)이다. 리페이스의 안면 변환 앱은 2020년 8월 기준 누적 다운로드 횟수 2,000만 회를 돌파하며 100개국에서 애플과 안드로이드 스토어 모두 인기 앱 1위를 차지했다. 리페이스 CEO 로만 모길니(Roman Mogylnyi)는 최근, 미국 테크 매체 테크크런치와의 인터뷰에서 앱의 딥페이크 품질 향상과 인물의 신체를 전부 변환하기 위한 앱 업그레이드를 기다리고 있다고 밝혔다. 모길니는 딥페이크 앱의 미래가 많은 사람이 일생에서 다른 삶을 살 기회를 주는 맞춤형 플랫폼이 되리라 생각한다. 하지만, 첨단화된 딥페이크 앱의 상업화는 앱 악용 문제와 관련된 우려를 제기한다.
얼핏 보아도 딥페이크 기술의 악용 사례는 이미 가시적으로 드러났다. 어느 한 논문의 공동 저자는 최근 텔레그램 앱에서 딥페이크 포르노 봇을 발견했다. 딥페이크 포르노 봇은 사용자가 딥페이크로 제작된 여성의 나체 이미지를 두고 의상을 착용한 여성의 옷을 벗기도록 한다. 총 10만 명이 넘는 여성과 미성년자의 딥페이크 이미지가 참가자 수 10만 명이 넘는 것으로 집계되는 텔레그램 채널에 공유됐다.
2020년 4월, 딥페이크 앱이 정치 관련 거짓 정보와 온라인상에 대중을 속일 수 있는 콘텐츠 유포를 촉발한다는 우려도 제기됐다. 당시 도널드 트럼프 전 대통령이 조잡하게 조작된 혀를 늘어뜨리면서 눈썹을 움직이는 모습이 담긴 조 바이든 현 대통령의 딥페이크 영상을 리트윗하자 우려가 더 심각해졌다. 당시 트럼프 전 대통령이 리트윗한 영상은 현실성이 없는 영상이지만, 향후 이와 비슷한 일이 더 많이 발생할 것이라는 점이 타당하다. 두 가지 사례 모두 딥페이크 앱이 대규모로 유해한 가짜 콘텐츠를 생성하고는 온라인에 이미지가 게재된 모든 이에게 위협을 가할 것이라는 우려스러운 미래를 나타낸다.
수많은 딥페이크 앱이 거짓 정보 혹은 유해 콘텐츠를 유포할 수 있다는 우려가 계속 이어지거나 제한될 수 있다. 사용자는 사전 승인된 영상 혹은 TV 쇼 내 지정된 장면에서 인물의 얼굴을 바꿀 수 있다. 그러나 이러한 제약은 종종 의도적인 보안을 위한 선택보다는 기술적 한계의 결과로 나타난다. 하나 이상의 소수 사용자 이미지로 특정 인물의 얼굴을 바꾼 고화질 콘텐츠를 제작하기 위해 딥페이크 앱은 여러 인기 영화 장면으로 생성 모델을 사전 훈련받는다. 영화 샤이닝 속 쌍둥이의 얼굴을 바꾸거나 반지의 제왕에 등장하는 션 빈의 밈을 변형하는 것과 같은 훈련을 받는다. 기술이 갈수록 뛰어난 성능을 자랑하고, 제약이 줄어든 상태에서 사전 훈련을 받자 개발자는 통제되지 않은 접근 방식을 택해 자신의 앱에 사용자가 업로드한 콘텐츠를 생성할 수 있도록 개방하며 경쟁으로 이익을 얻게 되었을 수도 있다.
립싱크와 음성 합성과 같이 잠재적으로 유해할 수 있는 서비스를 제공하는 테크 기업은 자사 제품이 악용되지 않도록 막는 정책을 채택했다. 채택된 정책 중에는 개인적으로 고객을 철저히 검증하는 것과 변경될 수 있는 제품 관련 모든 당사자에게 허가를 받는 것이다. 그러나 딥페이크 앱이 이와 비슷한 규정을 따르는 것을 상상하기 어렵다. 딥페이크 앱 상당수가 신종 딥페이크 기술의 능력을 간절히 원하는 수많은 사용자의 행동에 의존하기 때문이다. 딥페이크 앱이 복잡한 시장에서 사용자의 관심을 받고자 열망하기 때문에 제대로 통제하지 않는 것이 사실상 불가피할 것으로 보인다.
물론, 애플과 구글 모두 속임수를 기반으로 하거나 악의적인 딥페이크 앱을 자사 앱스토어에 배포하지 못하도록 하며, 개발자는 보안 기능을 위해 작업하며 딥페이크 악용 예방 정책 위반 문제를 피하려 한다. 딥페이크 악용을 막기 위한 애플과 구글의 조치에는 앱 전용 딥페이크 감지 툴과 음란물 및 악성 콘텐츠 자동 차단, 앱으로 생성한 딥페이크 콘텐츠 대상 워터마크 삽입 등이 포함됐다.
개발자가 자신이 개발한 딥페이크 앱 악용을 막을 준비가 됐다는 점은 고무적이지만, 보안 기능을 배포하는 데 몇 가지 어려움이 있다. 그중 하나는 개발자가 먼저 보안 기능을 배포할 방식이다. 악성 딥페이크를 막기위한 효과적인 감지 툴 배포 문제에 있어 개발자가 배포할 보안 기능은 SNS 플랫폼과 메시지 앱에서 널리 채택돼야 한다. 그러나 SNS 플랫폼 중, 현재 미디어 업로드 기능에 딥페이크 감지 기능을 구축한 플랫폼은 없다. 또, 왓츠앱이나 텔레그램과 같은 메시지 앱에 감지 기능을 설치하려면 사용자의 대화를 감시해야 한다. 이는 프라이버시에 집중한 현재의 메시지 앱 모델의 대대적인 변화가 필요하다.
또 다른 문제는 보안 조치의 신뢰성이다. 워터마크는 콘텐츠를 보는 이에게 가짜 영상임을 알려줄 수는 있지만, 개발자는 이미지 자체를 보기 불분명하게 만드는 곳에 워터마크를 삽입하는 것을 꺼린다. 즉, 프레임 일부를 잘라내야 한다는 의미이다. 선제 조치로 악성 콘텐츠를 감지하고 차단하는 것도 어렵다는 사실이 입증됐다. 그 근거로 갈수록 발전하고 있는 딥페이크 기술의 변화를 초래할 수 있는 유해할 수도 있는 광범위한 콘텐츠를 언급할 수 있다. 거의 제한적인 딥페이크 기술 악용은 현재 자동화하기 어렵다. 그러나 온라인 공간에서 생성되는 콘텐츠 양을 고려하면, 수동으로 악성 콘텐츠를 제어하는 것은 쉽지 않을 것이다.
위의 모든 문제를 고려했을 때, 딥페이크 앱 악용 문제를 최소화할 수 있는 합리적인 방법은 무엇일까? 한 가지 접근 방식으로 개발자를 위한 앱 안전 프레임워크 제작을 언급할 수 있다. 여기에는 위협 평가나 사용자 인증이 없는 제한된 접근 권한, 피해 완화가 없는 새로운 기능 배포 일시 금지 전략 등이 포함된다. 이와 같은 프레임워크를 앱스토어와 딥페이크 앱의 성공에 비판적인 여러 이해 관계자가 강행한다면, 모든 개발자가 발행 즉시 따를 수 있는 딥페이크 앱의 안전 표준을 만드는 데 도움이 될 것이다.
더 강력한 대응에는 딥페이크 앱이 악용될 가능성을 지니고 있거나 의도적으로 악용할 수 있도록 설계됐을 때, 피해자나 관리 당국이 개발자에게 책임을 묻도록 하는 법안이 포함될 것이다. 개발자에게 책임을 지도록 하는 법안에는 벌금 및 피해 보상 금액 지급, 앱 스토어에서 악용된 앱 삭제, 더 나아가 개발자의 형사 처벌이 포함될 수 있다. 이 모든 접근 방식이 공통적으로 지닌 특성은 앱 접근 권한을 지닌 대상을 제한하면서 앱에서 배포하는 기능을 제한하거나 결국 변경사항 때문에 피해를 일으킨 앱 개발자를 처벌하는 등 통제가 이루어지지 않는 딥페이크 앱을 대상으로 한다는 사실이다.
분명히 딥페이크 앱이 나아가는 데 내재한 마찰이 있다. 바로 딥페이크 앱이 개방되는 동시에 기능이 강화될수록 앱이 일으킬 수 있는 피해를 예방하기 어렵다는 문제이다. 개방성과 안전이라는 균형을 모두 적절하게 유지하는 것은 딥페이크 앱의 성공을 위한 기본적인 요소이다. 만약, 딥페이크 앱이 현재와 같이 계속 통제되지 않는 상태를 유지한다면, 개방성과 안전이라는 균형을 이루기 어려울 것이다.
** 위 기사는 와이어드UK(WIRED.co.uk)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)
<기사원문>
Deepfake apps are here and we can’t let them run amok
저작권자 © WIRED Korea 무단전재 및 재배포 금지
저작권자 © WIRED Korea 무단전재 및 재배포 금지
이 기사를 공유합니다