본문 바로가기 주메뉴 바로가기 검색 바로가기
‘가운뎃손가락’으로 아티스트의 AI 퇴치 돕는 새로운 툴 등장
상태바
‘가운뎃손가락’으로 아티스트의 AI 퇴치 돕는 새로운 툴 등장
아티스트가 자신의 작품이 무단으로 AI 훈련 데이터로 수집된 것을 확인하도록 돕는 툴인 ‘해브 아이빈 트레인드(Have I Been Trained?)’의 제작자가 새로 개발한 툴인 쿠두루는 아티스트가 웹 무단 수집을 차단하고, 수집 시 잘못된 이미지를 전송하도록 관리한다.
By KATE KNIBBS, WIRED US

인공지능(AI) 이미지 생성 툴이 처음 배포되었을 당시 마법과 같았다. 한 측면에서 보았을 때는 단 몇 분이면 상세 표현을 살린 이미지를 대거 생산한다는 점이 기술적으로 놀랍다고 말할 수 있다. 그러나 다른 각도에서 보면, 단순히 기존 이미지를 모방한 것에 지나지 않는다고 말할 수도 있다.

AI 이미지 생성 툴의 모델은 이미지를 생성한 인간의 허락 없이 이미지 수십억 장을 이용하여 훈련 과정을 거쳤다. 유럽 AI 규제 조합(European Guild for Artificial Intelligence Regulation)의 네덜란드 자문위원 역할을 하는 일러스트레이터 에바 투레넨트(Eva Toorenent)는 “AI 이미지 생성 툴은 아티스트 수백만 명의 창의력을 마구 이용했다. 끔찍한 일이다”라고 말했다.

AI 기업의 시가총액이 급등하자 예술 작품 창작 활동을 하던 이들이 작품 보상을 받지 못할 것이라는 생각을 하게 되었다. 많은 아티스트가 AI 이미지 생성 툴의 아티스트 작품 이용 방식에 강력히 반대한다. 아티스트 겸 작가 몰리 크래배플(Molly Crabapple)은 “AI 기업이 아티스트 고유의 화풍을 없애고는 아티스트를 가치가 없는 아티스트 작품으로 대체하는 것이 역겹다”라고 비판했다.

지난 1년간 AI 이미지 생성 툴의 인기가 상승하면서 일러스트레이터와 사진작가를 비롯한 기타 비주얼 아티스트는 자신의 작품이 AI에 무단 도용된 사실을 밝힐 방법을 판단하는 데 난항을 겪었다. 일부 아티스트는 작품을 무단으로 사용한 기업을 제소했다. 규제 당국의 개입을 요청하는 이들도 있다. 아티스트가 AI 이미지 생성 툴의 과거 훈련 방식을 바꿀 방법은 없다. 그러나 2023년 10월 13일(현지 시각), 스포닝(Spawning)이라는 스타트업이 AI 훈련 목적으로 작품이 동원되는 일을 막으려 새로운 시도를 펼치는 아티스트를 돕기 위한 신규 툴인 ‘쿠두루(Kudurru)’를 출시했다. 쿠두루는 웹 스크랩 활동 발생 시 이를 식별하는 여러 웹사이트의 네트워크이다. (쿠두루라는 이름은 경계와 소유권을 나타내는 돌을 지칭하는 메소포타미아어에서 유래됐다.)

쿠두루의 실행 과정을 정확히 이해하려면, AI 이미지 생성 툴 훈련 과정을 아는 것이 도움이 된다. 대다수 AI 이미지 생성 툴은 인터넷 스크랩 작업을 통해 훈련 데이터를 찾는다. 스크랩을 하는 이들은 데비언트아트(DeviantArt)와 같은 플랫폼부터 게티이미지와 같은 전문 사진 라이브러리, 개인 아티스트 웹사이트까지 웹 전 영역에서 데이터를 대거 수집하는 소프트웨어를 이용한다. 훈련용으로 모을 데이터를 결정할 때 가장 인기가 높으면서도 보편적으로 사용하는 로드맵은 이미지 수십억 장의 URL을 나열한 데이터세트 LAION-5B이다. LAION-5B와 같은 데이터세트로 이미지를 스크랩할 때 URL 링크에서 이미지를 내려받아야 한다. 바로 이 과정에서 쿠두루의 서비스 제공 시작점이 발견됐다.

스포닝 공동 창립자 조던 메이어(Jordan Meyer)는 내부 실험 과정에서 쿠두루가 일시적으로 대규모 스크랩 활동을 막을 수 있었다고 설명했다. 메이어는 “2023년 7월, 2시간가량 LAION-5B에서 이미지를 내려받으려는 과정이 모두 중단되었다”라고 말했다.
 
[사진=Freepik]
[사진=Freepik]

스포닝은 작품 무단 수집을 일삼는 이를 찾고자 1,000곳이 넘는 웹사이트의 방어 네트워크라는 매우 귀중한 네트워크를 운영했다. 스포닝이 발견한 웹사이트는 LAION-5B를 이용하여 한 집단으로 묶은 각각의 호스팅 이미지를 생성형 AI 훈련 목적으로 이용하는 곳이었다. 이미지 스크랩 웹사이트는 IP 주소로 데이털르 수집하여 이미지를 스크랩하려 했다. 스포닝은 종종 스크랩 행위를 하는 그룹과 스크랩 행위가 가장 종합적으로 이루어지는 지역을 확인할 수 있었다. (현재 이미지 스크랩 무단 행위가 가장 빈번하게 발생한 곳은 중국이다.)

스포닝 공동 창립자 패트릭 호프너(Patrick Hoepner)는 “기본적으로 이미지 무단 수집을 하는 웹사이트로 이루어진 블랙리스트를 개발한다”라고 말했다. 아티스트가 자신의 작품이 AI 훈련 목적으로 무단 수집된 적이 있는지 확인하도록 돕는 웹사이트인 해브 아이 빈 트레인드(Have I Been Trained?)도 개발한 스포닝은 추적한 IP 주소의 활동을 기준으로 블랙리스트를 실시간 업데이트한다.

쿠두루는 아티스트가 작품 무단 수집을 방해할 두 가지 방법을 제공한다. 첫 번째 방법은 단순히 블랙리스트에 포함된 IP 주소를 차단하는 것이다. 두 번째 방법은 IP 주소 차단 작업에서 더 나아가 웹 스크랩 웹사이트에서 요청한 것과는 다른 이미지를 전송하는 방식으로 웹 무단 수집 시도를 일시적으로 막거나 아예 방해하는 방법을 선택하는 것이다. 스포닝은 작품 무단 수집을 막고, 웹 스크랩 웹사이트에 대신 전송하고자 하는 이미지를 직접 선택하도록 한다. 스포닝도 웹 스크랩 웹사이트에 대신 전송할 이미지 몇 개를 제안한다. 메이어는 “웹 스크랩 시 수집하고자 한 작품 대신 가운뎃손가락을 펼친 이미지를 여러 차례 반복하여 전송할 수 있다”라고 언급했다.

방해 작업은 AI 이미지 생성 툴의 명령어 해석 방식을 망치는 반복 효과를 가져올 수 있다. 예를 들어, 필자가 필자의 사진을 포함한 개인 웹사이트를 개설했다면, 쿠두루를 이용하여 웹 스크랩 웹사이트에 필자의 사진이 아닌 가운뎃손가락을 펼친 이미지를 전송할 수 있다. 이때, AI 이미지 생성 툴은 “케이트 닙스 사진 스타일”이라는 명령어에 가운뎃손가락을 펼친 이미지를 생성하는 식으로 반응한다.

스포닝은 쿠두루와 같은 툴이 AI 이미지 생성 툴의 현재 훈련 방식을 방해하는 의미 있는 성과를 가져올 수 있을 것으로 기대한다. 쿠두루 사용자가 증가하면서 AI 기업의 작품 무단 수집 대응 규모와 권력도 더 커질 것이다.

쿠두루 베타 버전의 범위는 제한되었다. 현재 워드프레스 플러그인으로 개발됐으나 스포닝은 다른 플러그인 추가 출시와 영상과 오디오 무단 수집 방해 툴 출시 등을 계획 중이다. (스포닝은 텍스트 무단 수집 툴도 출시하기를 바라지만, 텍스트는 이미지 스크랩보다 방지하기 훨씬 더 어렵다.)

쿠두루는 아티스트에게 AI 훈련에 저항할 새로운 방법을 제공한다. 하지만 쿠두루에 앞서 원하지 않는 웹 스크랩을 중단하도록 설계된 툴이 출시됐다. 2023년 초, 시카고대학교는 스크랩 활동 시 혼란을 일으키려는 목적으로 글레이즈(Glaze)라는 툴을 출시했다. 글레이즈는 무단 수집한 이미지에 기본적으로 눈에 보이지 않는 워터마크 역할을 하는 ‘망토’를 추가했다. 워터마크는 스크랩 행위를 막으려는 시도로 설계되었다.

데이터돔(DataDome) 등 봇 보호 작업에 주력하는 기업은 지난 몇 년간 무단 스크랩을 막는 서비스를 제공했으며, 최근 들어 생성형 AI가 급부상하면서 큰 변화를 접했다. 데이터돔 CEO 벤자민 파브레(Benjamin Fabre)는 와이어드와의 인터뷰에서 AI 기반 스크랩 행위에 맞서 자신의 작품을 보호하고자 하는 고객이 급격히 증가했다고 전했다. 파브레는 “데이터돔 고객 70%는 챗GPT를 비롯한 여러 대규모 언어 모델 차단 사실을 보장하도록 요청하려 연락했다”라고 말했다.

데이터돔과 같은 기업은 제대로 입지가 확립되었으나 대기업을 고객사로 두고, 그에 따라 사용료를 청구한다. 보통 개인은 데이터돔 서비스를 사용할 수 없다. 이제 쿠두루가 등장하여 일반 사용자를 위한 무료 툴을 제공한다는 점에서 정확히 많은 소비자의 수요 충족을 약속한다.

하지만 쿠두루는 여전히 AI 스크랩을 멈추고자 하는 아티스트를 위한 포괄적인 해결책이나 영구적인 해결책이 되지 못한다. 크리에이터가 AI 훈련 방법을 다룬 의미 있는 규제나 법안 도입을 기다리는 가운데, 쿠두루를 AI 스크랩 일시 중단 방식으로 구상한다. 대다수 아티스트는 AI 훈련 목적의 작품 무단 스크랩을 막는 기업이 자발적으로 훈련 데이터 스크랩을 막지는 않을 것으로 생각한다.

저작권 운동가 닐 투케위츠(Neil Turkewitz)는 쿠두루의 등장이 AI 이미지 생성 툴의 작품 무단 수집 속도를 제한하는 대상일 뿐 업계 전반의 문제 해결 수단으로는 보지 않는다. 투케위츠는 “쿠두루와 같은 툴은 훌륭하다. 작품 무단 수집 방지 툴이 개발되어야 한다. 그리고 많은 이들이 사용해야 한다. 기본적으로 쿠두루와 같은 기술적 조처를 해결책으로 보지 않는다는 점이 확실하다”라고 말했다.

크래배플은 “아티스트의 작품 보호를 돕는 툴 개발 시도에 찬사를 보낸다. 그러나 궁극적으로 아티스트에게 부담을 안겨줄 것이다. 무단 수집 행위 방어 노력의 방향이 되어서는 안 된다. 한 가지 문제를 퇴치하면, 또 다른 문제가 등장할 때 그에 대응하는 방식으로 아티스트의 작품 탈취를 막고 거액을 보유한 기업이 문제를 반복해서는 안 된다. 작품 무단 수집을 막을 유일한 해결책은 법안 도입이다”라고 말했다.

AI 이미지 툴 훈련 방식의 포괄적이면서도 영구적인 변화는 정부 차원의 개입이 필요할 확률이 높다. 생성형 AI 개발 대기업이 자발적으로 웹 무단 수집 행위를 막을 확률이 낮다. 일각에서는 아티스트가 자신의 작품을 추후 훈련 세트에서 삭제하도록 요청하는 웹 스크랩 비활성화 기능을 생성하는 방식으로 비판 세력을 돕고자 한다. 직접 작품을 AI 훈련용으로 사용하도록 동의할 때만 훈련이 진행되는 것을 원하는 많은 아티스트는 웹 스크랩 비활성화 기능이 기껏해야 어리석은 반쪽짜리 대응 방식이라고 본다. 

더 심각한 문제는 많은 기업이 공통 시스템을 선택하지 않고, 기업마다 자체 훈련 데이터 수집 동의 선택 프로토콜을 개발하여 아티스트가 각각의 AI 이미지 생성 툴의 훈련 데이터에서 작품을 제거하는 일이 오랜 시간을 잡아먹는 일이 된 사실이다. (과거, 스포닝은 ‘해브 아이 빈 트레인드’의 초기 훈련 데이터 수집 동의 선택 툴 개발 작업을 한 적이 있다. 그러나 그 결과는 실망적이었다.)

유럽연합은 AI 훈련 시 아티스트 동의를 요구하는 법률 개발 노력을 가장 적극적으로 펼쳤다. 투레넨트는 “유럽연합의 AI 훈련 관련 법안 도입 시 작품 무단 수집 방지 효과가 뛰어날 것이다”라고 말했다. 투레넨트는 AI 법(AI Act)이 훈련 데이터 무단 수집 종료의 시작점이 될 것을 낙관한다. 물론, 세계 다른 지역에서도 유럽연합과 같은 수준의 노력을 펼쳐야 한다. AI 법은 아티스트가 훈련 데이터 수집 거부를 선택하도록 법률을 시행하는 데 도움이 될 수 있다. 그러나 AI 모델 자체가 훈련 데이터 수집 동의를 선택하도록 변경하지는 못한다. 즉, AI 모델 훈련 데이터 무단 수집 문제 대응 시 가야 할 길이 멀다. 또, 훈련 데이터 수집 동의 선택 구조가 현실이 되려면, 갈 길이 멀다. 하지만 이제는 쿠두루가 있다.

** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
A New Tool Helps Artists Thwart AI—With a Middle Finger
이 기사를 공유합니다
RECOMMENDED