본문 바로가기 주메뉴 바로가기 검색 바로가기
생성형 AI 저작권 전문 스타트업, 유튜브 크리에이터 대상 AI 훈련 데이터 사용 비용 지급 추진
상태바
생성형 AI 저작권 전문 스타트업, 유튜브 크리에이터 대상 AI 훈련 데이터 사용 비용 지급 추진
레딧과 같은 대형 플랫폼은 AI 대기업과 훈련 데이터 제공 계약을 체결했다. 하지만 유튜브의 AI 훈련 데이터 제공 라이선스 계약 체결은 크리에이터 개인의 몫으로 남겨졌다. 이에, 칼리오페 네트웍스라는 스타트업이 ‘라이선스 투 스크래프’ 프로그램을 통해 유튜브 크리에이터도 적절한 보상을 받도록 돕고자 한다.
By Kate Knibbs, WIRED US

지금까지 인공지능(AI) 기업이 유튜브의 가치 있는 영상, 자막 등 기타 콘텐츠로 데이터를 훈련했을 때는 저작권자의 허가를 받지 않았다. AI에 초점을 맞춘 라이선스 스타트업인 칼리오페 네트웍스(Calliope Networks)가 새로이 출시한 유튜브 스타를 위한 프로그램인 ‘라이선스 투 스크래프(License to Scrape)’를 통해 AI 기업의 당사자 동의 없는 유튜브 콘텐츠를 이용한 데이터 훈련 관행을 바꾸고자 한다.

칼리오페 네트웍스 CEO 데이브 데이비스(Dave Davis)는 “AI 기업 사이에서 유튜브 콘텐츠를 수집하고자 하는 수요는 확실히 존재한다. AI 기업의 행동을 보고 확인한 사실이다. 따라서 칼리오페 네트웍스는 합법적인 경로로 간단하게 유튜브 콘텐츠를 수집할 방법을 생성하고자 한다”라고 말했다. 레딧을 비롯한 대형 플랫폼과 달리 유튜브는 AI 거물급 기업과 영상 수집 협력 계약을 체결한 적이 없다. 라이선스 투 스크래프는 크리에이터 여러 명을 한 집단으로 묶고는 영상 저작권 전체를 두고 협상하는 방식으로 다량의 유튜브 영상을 한 번에 제공하면서 문제를 우회하고자 한다.

데이비스는 전통 미디어 라이선스 공급 분야에서 근무한 경험이 있다. 데이비스는 모션픽처라이선싱코포레이션(Motion Picture Licensing Corporation)의 비정규직 근로를 그만두고 칼리오페 네트웍스를 창업하며, AI 업계가 허가 없는 데이터 수집 관행과 거리를 두고 데이터 사용 라이선스 계약 체결을 정상화하는 방안을 추진하기 시작했다. 칼리오페 네트웍스는 모든 크리에이터와 권리자의 데이터 스크랩 활성화 선택 권한을 부여하도록 요구하는 업계 단체인 데이터세트공급자연합(Datasets Providers Alliance)의 창립 회원사이다.

데이비스가 원하는 유튜브 영상 수집 라이선스 계약 체결 과정은 다음과 같다. 자신의 데이터를 라이선스로 공급하고자 하는 유튜브 크리에이터는 칼리오페 네트웍스와 계약을 체결한다. 이후 칼리오페 네트웍스는 해당 유튜브 크리에이터의 작업물을 생성형 AI 근간 모델 훈련용으로 공급하는 하위 라이선스 계약을 체결한다. 먼저, AI 기업이 매력적인 계약 대상이라고 느낄 정도로 다량의 콘텐츠가 필요하다. 따라서 라이선스 투 스크래프는 유튜버가 계약 과정에 합류하여 제대로 된 라이선스 계약 체결과 실행이 이루어지도록 한다. 칼리오페 네트웍스는 AI 기업이 결제하는 라이선스 계약 체결 수수료의 1%를 청구한다.
 
[사진=Freepik]
[사진=Freepik]

AI 세계에는 라이선스 투 스크래프와 같은 AI 기업과 유튜버 간의 라이선스 계약은 없다. 하지만 데이비스는 미국 공연권 집중관리단체(BMI), 미국 작곡가, 작가, 출판사 협회(ASCAP) 등 다른 엔터테인먼트 업계의 데이터 스크랩 라이선스 포맷을 따라 라이선스 투 스크래프를 구상했다.

데이비스는 “AI 기업을 대상으로 한 유튜브 영상 수집 라이선스 요구 과정 추기이다”라고 말했다. 데이비스는 칼리오페 네트웍스가 최소 2만 5,000시간~5만 시간 상당의 유튜브 콘텐츠를 확보해야 AI 업계가 라이선스 계약을 진지하게 생각할 것이라고 전했다. 2만 5,000시간~5만 시간 분량의 영상이 저작권 라이선스 계약 협상을 위한 문턱일 확률이 높다는 점은 여러 영상을 결합하여 일부 크리에이터가 AI 훈련 데이터 공급 비용을 받고자 하는 이유를 설명한다. AI 훈련 데이터 공급 사업에서는 분량이 중요하다. 영상 생성 툴은 대부분 다량의 데이터를 바탕으로 역량을 발휘한다.

AI 기업의 훈련 데이터 공급 라이선스를 공식 지지하는 유명인은 아직 존재하지 않는다. 그러나 칼리오페 네트웍스는 이미 바이럴네이션(Viral Nation) 등 소수 인플루언서 마케팅 대행사를 고객사로 확보하기 위한 계약 초안을 작성했다. 비앙카 세라피니(Bianca Serafini) 바이럴네이션 콘텐츠 라이선스 사장은 “여러 크리에이터의 긍정적인 피드백을 받았다”라고 밝혔다. 세라피니는 유튜버 900여 명에 이르는 자사 고객 명단에 포함된 크리에이터 다수가 훈련 데이터 공급 목적의 라이선스 계약에 참여할 것으로 확신한다. 세라피니는 “지금까지 유튜브 크리에이터의 데이터를 정당하게 사용하기 위한 라이선스 계약을 제시한 기업이 단 한 곳도 없었다”라고 말했다.

유튜브는 모든 라이선스 계약 체결을 위해 어떤 일을 하는가? 데이비스는 유튜브와 AI 기업을 대상으로 한 유튜브 크리에이터의 콘텐츠 수집 라이선스 계약 프로젝트를 두고 직접 협업한 적이 없다고 전했다. 다만, 라이선스 투 스크래프가 거물급 영상 플랫폼인 유튜브의 바람과 일맥상통한다고 확신한다. 데이비스는 “유튜브가 크리에이터의 관리 권한을 더 부여하고자 한다고 생각한다”라고 말했다.

유튜브는 특정 라이선스 기업 관련 의견을 공개하지 않았으나 실제로 사용자가 AI 기업과 훈련 데이터 공급 라이선스 계약을 체결하는 것을 지지한다는 사실을 알 수 있다. 잭 말론(Jack Malon) 유튜브 대변인은 “전반적으로 크리에이터는 외부 기업과 유튜브 플랫폼에 게재한 자신의 콘텐츠 관련 계약을 체결할 수 있다”라고 말했다. 말론 대변인은 블로그를 통해 AI 시대에 유튜버의 관리 권한을 확대하고자 한다는 유튜브 측의 의도를 강조하기도 했다. 유튜브에는 권한 확보나 명백한 허가가 중요하다는 사실도 덧붙였다. 말론 대변인은 블로그에 “권한이 없는 크리에이터 콘텐츠 접근 행위는 유튜브 서비스 약관에 명시된 금지 행위이다. 따라서 유튜브는 외부 기관이 서비스 약관을 존중하도록 각종 조처를 계속 적용할 것이다”라고 작성했다.

라이선스 투 스크랩 프로그램의 성공은 유명 유튜버의 참여를 넘어선 영역에서도 살펴보아야 할 것이다. AI 기업의 데이터 훈련 접근 방식의 중요한 전환이 필요하다. 미국 법원에서 진행 중인 무단 데이터 수집 의혹으로 제기된 저작권 소송이 30건이 넘은 현재 라이선스 투 스크랩과 같은 프로그램의 도입에 따른 전환은 결과적으로 법률 의무사항 준수로 향하도록 할 것이다. 그러나 텍스트 기반 영상 생성 툴에는 종종 원활한 작업 처리를 위한 다량의 고품질 데이터가 필요하다. 따라서 추가 데이터 확보 경쟁에서는 다른 접근 방식이 필요하다.

그전까지 AI 대기업이 유튜브와 같은 곳에서 ‘공개적으로 접근이 가능하다’라고 주장하는 데이터 수집 행위를 멈출 계획이 있는지 확실하지 않다. 영상 중심 AI 스타트업 런웨이(Runway)가 영화 스튜디오 라이온스게이트(Lionsgate)와 계약을 체결한 것처럼 AI 기업이 생성형 AI의 근간 모델 훈련을 포함한 데이터 수집 계약을 체결한다면, 보통 훈련 과정에 투입되는 데이터는 공개적으로 접근이 가능한 데이터라고 볼 수 없다. AI 기업이 플랫폼, 출판 기업과 체결하는 계약 대부분 근간 모델 훈련보다는 서치GPT(SearchGPT)와 같은 AI 검색 상품에 콘텐츠를 제공한다는 목적에 더 초점을 맞춘다. 최근, 영국 내 인기 육아 포럼인 맘스넷(Mumsnet)의 무단 데이터 수집 문제를 둘러싼 법적 대응 위협을 직면한 오픈AI는 와이어드의 문의에 오픈AI는 주로 공개적으로 접근할 수 없는 대규모 데이터세트 라이선스 계약 체결에 관심이 있다고 밝혔다.

반면, 라이선스 투 스크래프 지지자는 단순히 AI 기업이 데이터 공급 라이선스 계약에 관심을 보일 때까지 기다릴 것이 아니라 앞으로 콘텐츠 저작권자의 데이터 수집에 따른 권리 인정을 위한 압박을 가할 때라고 확신한다. 세라피니는 “이제 크리에이터의 데이터 공급에 따른 보상을 위한 작업을 추진하기 시작했을 뿐이다”라고 말했다.

** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
This Startup Wants YouTube Creators to Get Paid for AI Training Data
이 기사를 공유합니다
RECOMMENDED