By Marah Eakin, WIRED US
2024년 9월 18일(현지 시각), 레바논에서 무선 호출기와 양방향 송수신 라디오 폭발로 사망자 수십 명, 부상자 수백 명이 발생하고 몇 시간 뒤 여러 팟캐스트 앱에 새로운 팟캐스트가 갑자기 등장하는 이상한 일이 관측됐다. 헤즈볼라를 겨냥한 삐삐 폭탄 공격 이후 등장한 ‘페이저 프로토콜(Pager Protocol)’이라는 팟캐스트는 헤즈볼라나 공격의 배후로 추정되는 이스라엘을 공격할 의도로 제작된 팟캐스트가 아니다. 유례없는 사건을 10부짜리로 구성된 가상의 팟캐스트로 신속하게 제작한 인공지능(AI) 생성 팟캐스트이다.
삐삐 폭탄 공격 당일 생성된 팟캐스트인 페이저 프로토콜은 오디오북과 비슷하다. 각각의 에피소드는 10~12분 분량의 오디오북 챕터와 비슷한 양으로 구성되었다. 처음 공개된 에피소드 2편에서 AI 해설은 가상의 정보기관 수장과 세계에서 경쟁하는 정보 요원, 미국 중앙정보국(CIA) 애널리스트의 이야기를 전한다. 팟캐스트가 전하는 이야기 모두 악의를 지닌 크레센드 쉴드(Crescent Shield)라는 가상의 테러 조직이 삐삐를 대량 주문한 사건을 쫓는 이야기이다. 팟캐스트에 언급된 국가와 지명은 실제와 다른 명칭으로 변경되었으나 누구나 팟캐스트에서 지칭하는 가상의 지역이나 국가가 실제로 어느 곳인지 충분히 짐작할 수 있다. (참고로 텔아비브는 ‘시온시티’라는 지명으로 언급됐다.)
페이저 프로토콜 제작사 칼로로간 샤크 미디어(Caloroga Shark Media) 공동 창립자 존 맥더모트(John McDermott)는 페이저 프로토콜을 “오디오 스토리텔링의 정점”으로 언급하며, “AI 통합 속도와 일시적인 심장 박동 증가와 결합한 방식을 보여준다”라고 전했다.
칼로로간 샤크 미디어의 다른 창립자인 마크 프란시스(Mark Francis)는 레바논에서 삐삐 폭탄 공격이 발생한 소식을 접하고, 공격 개시 과정이 궁금해졌다고 밝혔다. 그는 “매우 흥미로운 이야기의 정신을 담았다. 결국, 생성형 AI 툴인 클라우드(Claude)를 활용하여 아이디어를 구성했다. 클라우드는 이야기 개요를 전달했다”라고 말했다. 칼로로간 샤크 미디어팀은 신속하게 스크립트를 작성하고는 더 많은 메시지를 전달하고자 AI를 팟캐스트 제작 과정에서 열심히 활용했다. 탄탄한 스크립트가 완성된 후 오디오소닉(AudioSonic)과 일레븐랩스(ElevenLabs)에 명령을 주입하여 해설을 완성했다. 일부 팟캐스트 그림을 아이디어그램(Ideogram)으로 제작하고, 챗GPT와 클라우드로 에피소드 설명문을 작성하기도 했다.
프란시스는 “AI를 팟캐스트 제작 수단으로 활용했다. AI는 그 누구도 대체하지 않았다. 작업 속도와 품질, 프로그래밍 효율성을 향상하는 역할만 했다”라고 말했다.
일부 팟캐스트 기업이 적어도 수개월간 팟캐스트에 포함될 오디오 삽화를 제작하는 것과 달리 칼로로간 샤크 미디어는 크리에이터의 투자 수익에 더 큰 관심을 보였다. 10분 분량의 팟캐스트 에피소드를 여러 편 제작했다. 영국 왕실부터 코미디 뉴스까지 다양한 주제를 다룬 페이저 프로토콜의 에피소드 제목은 큰 영향력을 행사하지 않지만, 중간에 광고 한 편을 추가하여 비슷한 분량으로 완성된다. 주기적으로 청취하도록 유도하려는 전략이다. 효율적인 작업, 팟캐스트 생성 간소화, 팟캐스트 시장에 진출한 이들보다 더 빠른 장인정신 발휘 목적으로 AI를 활용했다.
프란시스는 스크립트와 에피소드를 신속하게 제작할 수 있다는 점에서 매주 텍스트를 팟캐스트 게재일과 가가운 시점에 작성하고, 레바논 전쟁 최신 소식을 추가로 통합할 수 있다고 전했다. 그는 “이야기의 현실성을 유지하는 데 도움이 됐다”라며, “3~4주 뒤의 이야기를 알지 못하는 시점에 당장 10편의 에피소드를 예측할 필요가 없다”라고 말했다.
빠른 작업 마감 속도를 두고 일부 제작자와 팬은 AI로 생성한 팟캐스트가 끔찍하다고 평가한다. 반댄로 생성형 AI 팟캐스트 제작이 업계에서 피할 수 없는 일이라고 생각하는 업계 관계자도 있다. AI와 팟캐스트 스튜디오를 결합한 스튜디오 원더크래프트(Wondercraft)를 ‘오디오 버전 캔버스’라고 칭하는 오스카 세란더(Oskar Serrander)는 AI가 문화 속도에 따라 창의적 작품을 생성하는 데 도움을 줄 수 있다고 본다. AI가 새로운 개념을 제시하기보다는 과거의 아이디어를 활용한다는 점과 같은 AI의 한계를 인정하면서도 일부 브랜드나 크리에이터의 팟캐스트 세계 진입 장벽을 낮출 수 있다는 점을 긍정적으로 평가한다.
세란더는 현재 팬아트 및 팬픽 커뮤니티인 온리팬스(OnlyFans)보다 팟캐스트 제작자가 더 적다는 점에 주목했다. 반면, 유튜브 채널 제작자는 수백만 명에 이르며, 틱톡을 포함한 여러 SNS 채널과 크리에이터가 사용자의 주목을 받고자 치열한 경쟁을 이어간다고 전했다. AI가 팟캐스트를 누구나 활용하도록 이끌어 결과적으로 팟캐스트 산업이 더 흥미로우면서도 수익성이 높은 산업이 될 것으로 기대한다.
팟캐스트 제작 분야에 깊이 투자하지 않는 상황을 확신하기는 어렵다. 비영리 디지털 라디오 유통사 PRX 최고 운영 책이맞 제이슨 살단하(Jason Saldanha)는 직접 협업한 크리에이터 사이에서 AI를 경계하는 목소리가 이어졌다고 전했다. 그 부분적인 이유는 매체의 실제 강점이 호스트와 청취자 간의 관계라고 확신하기 때문이다. (참고: PRX는 와이어드 모기업인 콘데나스트의 팟캐스트 유통사이다.)
AI로 팟캐스트를 20개 언어로 통역하고 전 세계로 진출 범위를 넓히고자 하는 유혹에 사로잡힐 수도 있다. 하지만 작업의 진실성이라는 경계로 향하게 될 것이다. 살단하는 “가장 성공한 팟캐스트는 청취자와 1대 1 관계를 형성했다. 청쥐자는 같튼 공간에 있는 누군가와 상호작용하거나 진행자와 일부 문제를 함께 해결하고자 협력한다고 생각한다”라고 말했다. AI 음성이 뉴스를 읽거나 특정 뉴스와 관련된 새로운 이야기를 생성하는 일에 발을 들이는 일은 팟캐스트 수익을 창출하고자 하는 이들이 혹할 만한 일이다. 그러나 살단하는 AI 팟캐스트로 수익성만 추구하는 전략이 장기적으로는 손실이 될 것이라고 본다.
살단하는 “오디오 기업 대부분 1990년대에 콘텐츠 약 50%가 공중파로 송출되던 시절 광고를 운영하던 전직 라디오 기업 경영진이 운영하는 기업이다. 이후 청취자가 광고가 너무 많은 상황에 불만을 품고 대체 미디어를 원하게 되어 냅스터(Napster), 스포티파이(Spotify) 등을 사용하기 시작했다”라고 말했다.
이제 라디오 기업 경영진은 디지털 오디오 생성 작업을 하면서 팟캐스트 수익화 전략을 다룰 방안을 모색한다. 디지털 오디오로 수익 창출 방안을 찾는 동시에 시장에 더 많은 팟캐스트를 추가한다면, 콘텐츠의 고급 가치가 줄어들어 팟캐스트 산업 전체가 위험에 빠질 수 있다.
살단하는 “디지털 오디오 기업은 시장에 콘텐츠를 대거 공급하여 청취자 참여도가 최저치에 기록하게 된다. 수익화 전략 측면에서는 괜찮더라도 장기적으로는 현명한 전략이 아니다. 범위가 커지면서 품질이 하락하여 수익을 위해 다른 문제를 일으킨다”라고 설명했다.
칼로로간 샤크 미디어 관계자의 견해는 다르다. 프란시스는 AI가 팟캐스트 제작 수단 결합의 일부분을 구성하여 복잡한 시장에서 독보적인 입지를 갖출 수 있다고 본다. 그는 “청취자는 AI 활용 유무를 떠나 영향력을 유지할 만한 가치가 있는 팟캐스트를 판단할 것이다”라고 말했다. 페이저 프로토콜은 AI를 팟캐스트 제작 수단으로 혼합할 수도, 아닐 수도 있다.
** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)
<기사원문>
Soon After the Deadly Hezbollah Pager Explosions, This AI-Generated Podcast Went Up
2024년 9월 18일(현지 시각), 레바논에서 무선 호출기와 양방향 송수신 라디오 폭발로 사망자 수십 명, 부상자 수백 명이 발생하고 몇 시간 뒤 여러 팟캐스트 앱에 새로운 팟캐스트가 갑자기 등장하는 이상한 일이 관측됐다. 헤즈볼라를 겨냥한 삐삐 폭탄 공격 이후 등장한 ‘페이저 프로토콜(Pager Protocol)’이라는 팟캐스트는 헤즈볼라나 공격의 배후로 추정되는 이스라엘을 공격할 의도로 제작된 팟캐스트가 아니다. 유례없는 사건을 10부짜리로 구성된 가상의 팟캐스트로 신속하게 제작한 인공지능(AI) 생성 팟캐스트이다.
삐삐 폭탄 공격 당일 생성된 팟캐스트인 페이저 프로토콜은 오디오북과 비슷하다. 각각의 에피소드는 10~12분 분량의 오디오북 챕터와 비슷한 양으로 구성되었다. 처음 공개된 에피소드 2편에서 AI 해설은 가상의 정보기관 수장과 세계에서 경쟁하는 정보 요원, 미국 중앙정보국(CIA) 애널리스트의 이야기를 전한다. 팟캐스트가 전하는 이야기 모두 악의를 지닌 크레센드 쉴드(Crescent Shield)라는 가상의 테러 조직이 삐삐를 대량 주문한 사건을 쫓는 이야기이다. 팟캐스트에 언급된 국가와 지명은 실제와 다른 명칭으로 변경되었으나 누구나 팟캐스트에서 지칭하는 가상의 지역이나 국가가 실제로 어느 곳인지 충분히 짐작할 수 있다. (참고로 텔아비브는 ‘시온시티’라는 지명으로 언급됐다.)
페이저 프로토콜 제작사 칼로로간 샤크 미디어(Caloroga Shark Media) 공동 창립자 존 맥더모트(John McDermott)는 페이저 프로토콜을 “오디오 스토리텔링의 정점”으로 언급하며, “AI 통합 속도와 일시적인 심장 박동 증가와 결합한 방식을 보여준다”라고 전했다.
칼로로간 샤크 미디어의 다른 창립자인 마크 프란시스(Mark Francis)는 레바논에서 삐삐 폭탄 공격이 발생한 소식을 접하고, 공격 개시 과정이 궁금해졌다고 밝혔다. 그는 “매우 흥미로운 이야기의 정신을 담았다. 결국, 생성형 AI 툴인 클라우드(Claude)를 활용하여 아이디어를 구성했다. 클라우드는 이야기 개요를 전달했다”라고 말했다. 칼로로간 샤크 미디어팀은 신속하게 스크립트를 작성하고는 더 많은 메시지를 전달하고자 AI를 팟캐스트 제작 과정에서 열심히 활용했다. 탄탄한 스크립트가 완성된 후 오디오소닉(AudioSonic)과 일레븐랩스(ElevenLabs)에 명령을 주입하여 해설을 완성했다. 일부 팟캐스트 그림을 아이디어그램(Ideogram)으로 제작하고, 챗GPT와 클라우드로 에피소드 설명문을 작성하기도 했다.
프란시스는 “AI를 팟캐스트 제작 수단으로 활용했다. AI는 그 누구도 대체하지 않았다. 작업 속도와 품질, 프로그래밍 효율성을 향상하는 역할만 했다”라고 말했다.
일부 팟캐스트 기업이 적어도 수개월간 팟캐스트에 포함될 오디오 삽화를 제작하는 것과 달리 칼로로간 샤크 미디어는 크리에이터의 투자 수익에 더 큰 관심을 보였다. 10분 분량의 팟캐스트 에피소드를 여러 편 제작했다. 영국 왕실부터 코미디 뉴스까지 다양한 주제를 다룬 페이저 프로토콜의 에피소드 제목은 큰 영향력을 행사하지 않지만, 중간에 광고 한 편을 추가하여 비슷한 분량으로 완성된다. 주기적으로 청취하도록 유도하려는 전략이다. 효율적인 작업, 팟캐스트 생성 간소화, 팟캐스트 시장에 진출한 이들보다 더 빠른 장인정신 발휘 목적으로 AI를 활용했다.
프란시스는 스크립트와 에피소드를 신속하게 제작할 수 있다는 점에서 매주 텍스트를 팟캐스트 게재일과 가가운 시점에 작성하고, 레바논 전쟁 최신 소식을 추가로 통합할 수 있다고 전했다. 그는 “이야기의 현실성을 유지하는 데 도움이 됐다”라며, “3~4주 뒤의 이야기를 알지 못하는 시점에 당장 10편의 에피소드를 예측할 필요가 없다”라고 말했다.
빠른 작업 마감 속도를 두고 일부 제작자와 팬은 AI로 생성한 팟캐스트가 끔찍하다고 평가한다. 반댄로 생성형 AI 팟캐스트 제작이 업계에서 피할 수 없는 일이라고 생각하는 업계 관계자도 있다. AI와 팟캐스트 스튜디오를 결합한 스튜디오 원더크래프트(Wondercraft)를 ‘오디오 버전 캔버스’라고 칭하는 오스카 세란더(Oskar Serrander)는 AI가 문화 속도에 따라 창의적 작품을 생성하는 데 도움을 줄 수 있다고 본다. AI가 새로운 개념을 제시하기보다는 과거의 아이디어를 활용한다는 점과 같은 AI의 한계를 인정하면서도 일부 브랜드나 크리에이터의 팟캐스트 세계 진입 장벽을 낮출 수 있다는 점을 긍정적으로 평가한다.
세란더는 현재 팬아트 및 팬픽 커뮤니티인 온리팬스(OnlyFans)보다 팟캐스트 제작자가 더 적다는 점에 주목했다. 반면, 유튜브 채널 제작자는 수백만 명에 이르며, 틱톡을 포함한 여러 SNS 채널과 크리에이터가 사용자의 주목을 받고자 치열한 경쟁을 이어간다고 전했다. AI가 팟캐스트를 누구나 활용하도록 이끌어 결과적으로 팟캐스트 산업이 더 흥미로우면서도 수익성이 높은 산업이 될 것으로 기대한다.
팟캐스트 제작 분야에 깊이 투자하지 않는 상황을 확신하기는 어렵다. 비영리 디지털 라디오 유통사 PRX 최고 운영 책이맞 제이슨 살단하(Jason Saldanha)는 직접 협업한 크리에이터 사이에서 AI를 경계하는 목소리가 이어졌다고 전했다. 그 부분적인 이유는 매체의 실제 강점이 호스트와 청취자 간의 관계라고 확신하기 때문이다. (참고: PRX는 와이어드 모기업인 콘데나스트의 팟캐스트 유통사이다.)
AI로 팟캐스트를 20개 언어로 통역하고 전 세계로 진출 범위를 넓히고자 하는 유혹에 사로잡힐 수도 있다. 하지만 작업의 진실성이라는 경계로 향하게 될 것이다. 살단하는 “가장 성공한 팟캐스트는 청취자와 1대 1 관계를 형성했다. 청쥐자는 같튼 공간에 있는 누군가와 상호작용하거나 진행자와 일부 문제를 함께 해결하고자 협력한다고 생각한다”라고 말했다. AI 음성이 뉴스를 읽거나 특정 뉴스와 관련된 새로운 이야기를 생성하는 일에 발을 들이는 일은 팟캐스트 수익을 창출하고자 하는 이들이 혹할 만한 일이다. 그러나 살단하는 AI 팟캐스트로 수익성만 추구하는 전략이 장기적으로는 손실이 될 것이라고 본다.
살단하는 “오디오 기업 대부분 1990년대에 콘텐츠 약 50%가 공중파로 송출되던 시절 광고를 운영하던 전직 라디오 기업 경영진이 운영하는 기업이다. 이후 청취자가 광고가 너무 많은 상황에 불만을 품고 대체 미디어를 원하게 되어 냅스터(Napster), 스포티파이(Spotify) 등을 사용하기 시작했다”라고 말했다.
이제 라디오 기업 경영진은 디지털 오디오 생성 작업을 하면서 팟캐스트 수익화 전략을 다룰 방안을 모색한다. 디지털 오디오로 수익 창출 방안을 찾는 동시에 시장에 더 많은 팟캐스트를 추가한다면, 콘텐츠의 고급 가치가 줄어들어 팟캐스트 산업 전체가 위험에 빠질 수 있다.
살단하는 “디지털 오디오 기업은 시장에 콘텐츠를 대거 공급하여 청취자 참여도가 최저치에 기록하게 된다. 수익화 전략 측면에서는 괜찮더라도 장기적으로는 현명한 전략이 아니다. 범위가 커지면서 품질이 하락하여 수익을 위해 다른 문제를 일으킨다”라고 설명했다.
칼로로간 샤크 미디어 관계자의 견해는 다르다. 프란시스는 AI가 팟캐스트 제작 수단 결합의 일부분을 구성하여 복잡한 시장에서 독보적인 입지를 갖출 수 있다고 본다. 그는 “청취자는 AI 활용 유무를 떠나 영향력을 유지할 만한 가치가 있는 팟캐스트를 판단할 것이다”라고 말했다. 페이저 프로토콜은 AI를 팟캐스트 제작 수단으로 혼합할 수도, 아닐 수도 있다.
** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)
<기사원문>
Soon After the Deadly Hezbollah Pager Explosions, This AI-Generated Podcast Went Up
저작권자 © WIRED Korea 무단전재 및 재배포 금지
저작권자 © WIRED Korea 무단전재 및 재배포 금지
이 기사를 공유합니다