대메뉴 바로가기 본문 바로가기

한국저작권위원회

인기검색어
폰트, 음악, PPT, 일러스트
전체 메뉴

사이트맵

닫기

저작권동향

저작권동향 상세보기
제목 2024년 제19호-[독일] 저작권 이니셔티브(Initiative Urheberrecht)의 ⸢저작권 및 생성형 인공지능 학습⸥ 연구보고서 공개(박희영)
담당부서 국제통상협력팀 손휘용(0557920089) 등록일 2024-10-31
첨부문서

2024년 제19호-[독일] 저작권 이니셔티브(Initiative Urheberrecht)의 ⸢저작권 및 생성형 인공지능 학습⸥ 연구보고서 공개(박희영).pdf 미리보기

[독일] 저작권 이니셔티브(Initiative Urheberrecht)저작권 및 생성형 인공지능 학습연구보고서 공개

독일 막스플랑크 국제형법연구소 연구원/법학박사

박희영

 

 

1. 기초사실

 

독일 함부르크 지방법원은 2024927일 크네쉬케 대 라이온(Kneschke vs. LAION) 사건에서 데이터셋의 제작 과정에서 발생하는 저작권 침해와 이러한 침해가 텍스트 및 데이터 마이닝(TDM) 제한 규정으로 정당화될 수 있는지에 대하여 최초로 판결했음. 이 판결이 선고되기 전 독일의 저작권 관련 단체인 저작권 이니셔티브’(Initiative Urheberrecht)의 위탁으로 수행된 연구보고서가 202495일 공개되었음. 인공지능 전문가와 저작권법 전문가로 구성된 2명의 교수 연구진이 저작권 및 생성형 인공지능 학습이란 제목으로 수행한 이 연구보고서는 생성형 인공지능의 기술적 연구를 토대로 저작권법의 문제를 분석 및 평가하고 있음. 함부르크 지방법원도 판결문에서 이 보고서를 인용하고 있음.

하지만 이 보고서는 특히 상세한 기술적 연구를 토대로 저작권법의 문제를 구체적으로 다루고 있고, 연구의 결과가 기존 학계의 다수의견이나 지방법원의 견해와 상당한 차이를 보이고 있음. 따라서 이 보고서의 핵심 내용이라 할 수 있는 생성형 인공지능 학습과 관련한 저작권 침해행위저작권법의 제한 규정의 적용 여부에 대해서 간략하게 소개함.

 

 

2. ‘저작권 및 생성형 인공지능 학습에 관한 연구보고서

 

 

(1) 생성형 인공지능 학습과 관련한 침해행위

 

연구보고서는 첫째 학습에 이용된 보호 저작물의 수집, 준비 및 저장과 관련하여 저작권법 제16조 제1항의 복제가 발생한다고 평가하고 있음. 이러한 평가는 지방법원 판결이 다룬 데이터셋의 구축 과정에서 발생하는 복제권 침해와 동일함.

둘째, 생성형 AI 모델의 학습 과정에서도 저작권법 제16조 제1항의 복제권을 침해하는 행위가 발생한다고 평가하고 있음. 생성형 AI 시스템의 학습 과정에서, 즉 사전 학습(Pre-Training) 및 미세 조정(Fine-Tuning) 중 학습에 이용된 저작물이 모델 '내부'에서 복제된다고 함. 생성형 AI 시스템 내부에 명확한 저장매커니즘은 설계되어 있지 않지만, 현재의 생성 모델인 대규모 언어 모델(LLM)과 확산 모델(Diffusion Modell)은 학습 데이터를 기억하고 있다고 함. 따라서 특히 AI 시스템 이용자가 생성형 AI 모델을 사용하면(: OpenAI 웹사이트를 통한 ChatGPT 이용) AI 모델 학습에 이용된 저작물의 복제 및 변형이 발생할 수 있다고 함.

셋째, 이러한 인공지능 시스템에서 구현된 생성형 인공지능 모델을 이용자가 이용하거나 모델 전체를 다운로드할 수 있게 하는 것은 학습에 이용되고 모델 내부에서 복제된 저작물의 일부를 공중에게 제공하는 것이므로, 이러한 행위는 공중접근권(=전송권)을 침해할 수 있다고 한다(저작권법 제15조 제2, 19a).

따라서 이 보고서는 생성형 AI 모델의 학습 준비 과정, 학습 과정 그리고 이용과 관련한 전체 과정에서 저작권 침해가 발생할 수 있다고 평가하고 있음.

 

(2) 저작권법 제한 규정의 적용 여부

 

연구보고서는 또한 현재 적용되고 있는 대부분 저작권 제한 규정들은 생성형 AI 모델 학습에는 적용되지 않는다고 함.

 

1) TDM 제한 규정

 

연구보고서는 특히 저작권법상 TDM 제한 규정이 생성형 AI 모델 학습에는 적용되지 않는다고 주장함. TDM 제한 규정을 생성형 AI 모델 학습에 적용할 수 없는 이유를 다음과 같이 제시하고 있음.

첫째, TDM의 기술적 기반과 생성형 AI 모델의 학습 방법의 차이점임. TDM은 저작물의 의미 정보의 추출로 제한되는 반면, 생성형 AI 모델의 학습은 저작물에 포함된 의미 정보의 순수한 분석으로 제한되지 않고, 특히 문장 구조, 단어 순서, 문체 등 구문 정보도 포함된다고 함. 그리하여 AI 모델은 학습한 내용을 벡터 공간에 표현한다고 함. 벡터 공간은 데이터의 특징을 여러 차원의 숫자로 나타내는 공간을 말함. , 텍스트 데이터가 AI 모델 학습을 거쳐 고차원적인 숫자 데이터로 변환되어 저장된다는 것임. 이 과정에서 원본 텍스트의 의미와 구조, 문체적 특징이 모델 내부에 반영된다고 함. 생성형 AI 모델이 학습 데이터를 벡터 공간에 표현하는 과정은 원본 저작물을 새로운 형태로 '고정'하는 것이라고 해석될 수 있으므로, 텍스트 형태의 저작물이 AI 모델 내부에 숫자 데이터의 형태로 변환되어 저장되는 것은 저작권법 제16조의 복제에 해당할 수 있다는 것임. 따라서 연구보고서는 생성형 AI 모델의 학습은 TDM 제한 규정에 포함될 수 없다고 함.

둘째, TDM 제한 규정에 대한 역사적 해석임. DSM 지침의 입법자는 창의적이고 생산적인 AI 시스템의 기술적 발전과 그 파괴적인 효과를 예견하지 못했다고 함. 전통적인 TDM 제한 규정은 의미 정보의 이용만을 위해 고안되었기 때문에, 구문을 종합적으로 평가하는 생성형 AI 모델에 이를 확장해서는 안 된다고 함. 또한 EU 인공지능법(AI Act)의 입법 과정에서도 구체적인 입법 의도가 인정되지 않았고, 특히 입법자가 TDM과 생성형 AI 모델 학습의 차이점을 고려하지 않았다고 함.

셋째, TDM 규정을 적용하더라도 생성형 AI 모델의 학습은 국제 및 유럽 저작권법의 3단계 테스트에 위반될 수 있다고 함. 저작권으로 보호되는 저작물의 구문 정보를 종합적으로 이용하는 것은 저작권법에 따라 권리자에게 부여된 정상적인 이용을 침해하는 것으로 보아야 하며, 따라서 연구보고서는 테스트 기준을 위반한 것으로 보고 있음.

이러한 연구보고서의 평가와 달리 지방법원의 판결은 소송 대상이 데이터셋에 한정되었지만 상관 관계와 관련하여 TDM 제한 규정의 적용을 인정하였을 뿐 아니라 3단계 테스트도 인정하였음.

 

2) 기타 제한 규정

 

한편 연구보고서는 학습데이터의 수집, 준비 및 저장과 관련하여 발생하는 복제 행위는 일시적 복제 행위의 제한규정에 해당되지 않는다고 한다(저작권법 제44a, 정보사회저작권 지침 제5조 제1). 이 점은 지방법원의 견해와 같음.

또한 인용권(51), 풍자, 패러디 및 패스티시(51a), 사적 이용(53), 비본질적 부속물 제한(57)도 적용되지 않는다고 함.

 

 

3. 정리

 

연구보고서는 TDM과 생성형 AI 모델 학습 사이의 기술적 차이를 강조하면서, AI 학습이 단순히 저작권으로 보호되는 단순한 의미 정보의 추출을 넘어서 구문 정보까지 포함한다는 점에서 TDM 제한 규정의 적용 범위에 대한 논란이 예상됨. 보고서는 또한 DSM 지침 입법 당시 생성형 AI의 발전을 예측하지 못했다는 점을 들어 TDM 제한 규정의 확장 적용에 반대함. 나아가서 보고서는 생성형 AI 모델의 학습이 저작권자의 정상적인 이용을 침해할 수 있다고 보아 3단계 테스트를 위반할 수 있다고 주장함.

 

 

 

참고자료

 

Dornis, Tim W./Stober, Sebastian, Urheberrecht und Training generativer KI-Modelle - technologische und juristische Grundlagen, nomos 2024. (연구보고서 : https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4946214)

  • 담당자 : 손휘용
  • 담당부서 : 국제통상협력팀
  • 전화번호 : 055-792-0089

본 페이지의 내용이나 사용 편의성에 대해 만족하십니까?

  • 만족도 총 5점 중 5점
  • 만족도 총 5점 중 4점
  • 만족도 총 5점 중 3점
  • 만족도 총 5점 중 2점
  • 만족도 총 5점 중 1점
평가하기