제목 | 저작권 이슈 브리프(2025-6-3호) | ||
---|---|---|---|
담당부서 | 심의산업통계팀 전상홍 | 등록일 | 2025-06-24 |
첨부문서 | |||
ISSN 2983-1954 (Online)
□ Comma v.01 사례로 본 ‘공개 데이터 기반 LLM의 가능성’과 저작권 고려 방식 ○ 저작권 적용된 텍스트 자료 포함한 학습 데이터 확보 방식에 대한 논란 지속 - AI 학습 데이터 확보 과정에서 저작권 침해 논란이 지속되는 가운데, MIT·카네기멜런대·토론토대 공동연구팀이 개발한 ‘Comma v0.1’은 전량 공개 도메인 및 오픈 라이선스 데이터만으로도 고성능 모델 구축이 가능하다는 사실을 입증한 사례로 볼 수 있다. - Comma 프로젝트는 자동 수집 방식 대신 사람이 직접 문서를 검토하여 라이선스 조건과 학습 적합성을 확인한 데이터를 기반으로 모델을 구성하였으며, 이 방식은 상업용 모델과 유사한 성능을 달성함과 동시에 데이터 출처의 투명성과 법적 요건 충족 가능성을 함께 고려한 구조로 평가된다. - AI 산업 전반에 걸쳐 ‘출처 추적 가능한 학습데이터’에 대한 관심이 높아지는 시점에서, 이러한 방향성이 데이터 투명성과 저작권 정합성을 모두 충족시킬 수 있는 실질적 대안이 될 수 있을지 주목해 볼 만하다. ※ (주제어) 텍스트 자료, AI 학습 데이터 확보, 학습 데이터 확보 방식, 저작권 고려 방식, 저작권 침해 논란, 공개 데이터 기반 LLM의 가능성, MIT·카네기멜런대·토론토대 공동연구팀, Comma 프로젝트, Comma v.01, 전량 공개 도메인, 오픈 라이선스 데이터, 라이선스 조건, 학습 적합성, 데이터 출처, 투명성, 데이터 투명성, 데이터 정합성, 학습 적합성, 법적 요건 충적 가능성, 출처 추적 가능한 학습데이터
□ 저작권 확보 데이터 기반 생성형 AI 확산, 산업 전반에 ‘저작권 준수형 모델’ 개발 가속 ○ 저작권 문제 해결 위한 라이선스 데이터 기반 학습의 증가 - 미저작권 문제 해결을 위한 라이선스 데이터 기반 AI 학습이 증가하고 있다. - 일루서AI(EleutherAI)는 8TB 규모의 라이선스 확보 오픈 도메인 텍스트 데이터셋 '커먼 파일' 을 공개했으며, 이로 훈련된 모델이 저작권 미확보 데이터로 학습된 모델과 동등한 성능을 보여 라이선스 데이터만으로도 고성능 AI 개발이 가능함을 입증했다. - 주요 AI 기업들은 저작권 분쟁 리스크 최소화를 위해 워싱턴 포스트, 타임지 등 콘텐츠 제공업체와 라이선스 계약을 확대하는 추세다. ※ (주제어) 라이선스 데이터, 라이선스 데이터 기반 학습, 라이선스 데이터 기반 AI 학습, 저작권 확보 데이터 기반 생성형 AI, 저작권 준수형 모델, 일루서AI, 라이선스 확보 오픈 도메인 텍스트 데이터셋, 커먼 파일, 라이선스 계약, 콘텐츠 제공업체, 워싱턴 포스트, 타임지
□ 틱톡, ‘틱톡 포 아티스트’ 출시…아티스트 대상 데이터 분석 플랫폼 강화 ○ ‘틱톡 중심의 ‘음악 발견’ 생태계 확립 - 틱톡이 2025년 6월 3일 아티스트 전용 데이터 분석 플랫폼 ‘틱톡 포 아티스트’를 26개국에서 동시 출시했다. - 이 플랫폼은 일일 업데이트 분석 대시보드, 곡별 성과 추적, 팔로워 인사이트, 선공개 캠페인 도구 등 올인원 음악 인사이트 기능을 제공한다. - 틱톡의 음악 산업 영향력은 데이터로 입증되고 있다. 2024년 빌보드 ‘글로벌 200’ 진입곡의 84%가 틱톡에서 먼저 바이럴되었으며, 틱톡 사용자들이 새로운 음악을 발견하고 공유할 가능성은 일반 숏폼 비디오 사용자보다 74% 높다. - ‘틱톡 포 아티스트’ 플랫폼 출시는 숏폼 비디오와 스트리밍 서비스 간 연동을 체계화하여 통합 마케팅 생태계를 구축하는 전환점이 될 것으로 전망된다. ※ (주제어) 스트리밍 서비스, 숏폼 비디오, 틱톡, 틱톡 포 아티스트, 아티스트 대상 데이터 분석 플랫폼, 아티스트 전용 데이터 분석 플랫폼
□ 英 스크린 산업, AI 시대 창작자 보호와 권리 인프라 구축 요구 확산 ○ 산업계, 옵트아웃(Opt-out) 정책에 강력한 우려 표출 - AI 기업의 무단 학습으로 영국 스크린 산업이 위협받고 있다. - BFI 보고서에 따르면 13만 편의 영화 · TV 스크립트가 권리자 동의 없이 AI 훈련에 사용됐으며, 이는 1,250억 파운드 규모의 스크린 산업에 직접적 피해를 초래한다. - 영국 정부가 추진 중인 옵트아웃 제도는 월리스와 그로밋 제작 중단 우려 등 창작자의 부담을 가중시킨다. - 엘튼 존 등 예술계 인사들은 정부 정책에 공개 반대하며 보호 대책을 촉구했고, 디즈니 · NBC유니버설은 저작권 침해 사례에 대해 법적 대응에 나섰다. - 창작자 보호와 AI 혁신의 균형을 위해 옵트인 기반 라이선스 체계와 기술 · 금융 · 교육 지원이 요구되고 있다. ※ (주제어) BFI, 스크린 산업, 영국 스크린 산업, 옵트아웃(Opt-out) 정책, 옵트아웃 제도, 무단 학습, 영화 · TV 스크립트, 창작자 보호, 옵트인 기반 라이선스 체계, 권리 인프라, 월리스와 그로밋, 엘튼 존, 디즈니, NBC유니버설
□ 국제표현학습학회 ICLR, AI 워터마킹 워크숍 개최로 콘텐츠 보호기술 논의 ○ 콘텐츠 진위성 위기에 워터마킹 기술의 중요성 지속 증대 - 2025년 4월 싱가포르에서 열린 국제표현학습학회 ICLR(International Conference on Learning Representations) 내 ‘생성형 AI 워터마킹 워크숍(WMARK)’에서는 생성형 AI 콘텐츠의 텍스트, 이미지, 오디오, 비디오 등 전 영역에 걸친 워터마킹 기술이 연구 수준을 넘어 실용 기술로 빠르게 발전하고 있음을 보여주었다. - 주요 AI 기업들도 실제 제품 사례와 패널 토론에 참여하여, 워터마킹이 위조 방지, 저작권 보호, 콘텐츠 출처 검증을 위한 핵심 기술로 주목받고 있다고 강조했다. - 이번 워크숍은 기술 논의에 그치지 않고 규제와 정책 연계를 위한 표준 설계, 탐지 도구의 책임성 확보, 적응형 공격 방어 전략 등 생성형 콘텐츠의 법적·사회적 신뢰성을 뒷받침할 산업 전반의 전환점으로 평가된다. ※ (주제어) 콘텐츠 진위성, 콘텐츠 보호기술, 생성형 AI 콘텐츠, 텍스트, 이미지, 오디오, 비디오, 워터마킹 기술, 콘텐츠 출처 검증, 국제표현학습학회, ICLR, AI 워터마킹 워크숍, 생성형 AI 워터마킹 워크숍
□ 주간기술동향 ○ LVLM과 CopyJudge를 활용한 AI 이미지 저작권 침해 대응 기술 고찰 - 최근, 생성형 이미지의 출력물을 대상으로 저작권 침해 여부를 사전에 탐지하거나 특정 조건하에 생성 자체를 완화하거나 억제할 수 있는 기술적 구조가 필요하다는 인식이 확산되고 있다. - 특히, 모델 자체가 법적 판단을 모사하거나, 출력 과정에서 법적 책임이 문제되지 않도록 조치하는 시스템 내장형 기술이 주목받고 있다. - 본 보고서에서는 생성 이미지와 원본 이미지 간의 유사도를 평가하여 침해 가능성을 자동 탐지하는 방식과, 사용자의 프롬프트가 침해 가능성을 내포한 경우, 생성 단계에서 자동으로 이를 차단하거나 대체 콘텐츠를 제공하는 기술적 시도를 살펴본다. ※ (주제어) 원본 이미지, 생성 이미지, 생성형 이미지, AI 이미지 저작권 침해 대응 기술, LVLM, CopyJudge |