첫 화면 메뉴 바로가기 본문 내용 바로가기

한국저작권위원회

인기검색어
폰트, 음악, PPT, 일러스트
전체 메뉴
닫기

저작권동향

저작권동향 상세보기
제목 [이슈리포트] 2023-17 인공지능학습과 저작권 제한(박희영)
담당부서 국제통상협력팀 이동호(0557920189) 등록일 2023-12-27
첨부문서

[이슈리포트] 2023-17 인공지능학습과 저작권 제한(박희영).pdf 미리보기

인공지능학습과 저작권 제한

- 유럽연합 저작권지침 및 독일 저작권법의 텍스트 및 데이터 마이닝(TDM)

독일 막스플랑크 국제형법연구소 연구원, 법학박사

박희영

1. 머리말

202211ChatGPT가 출시된 이후, 인공지능(AI)으로 생성된 이미지가 소셜 미디어에 넘쳐나고 있다. Open AIDALL-E AI 모델은 인터넷 사용자가 텍스트 입력을 기반으로 이미지를 생성하여 온라인에 게시할 수 있도록 했다. 그 후 Stability AI의 오픈 소스인 Stable Diffusion, Midjourney, Deviant ArtDreamUp, PrismaLensaAI, GoogleImagen이 등장했다. 이 모델들은 이미지와 텍스트의 조합으로 구성된 대량의 데이터로 학습된다. 이러한 방대한 학습 데이터 세트는 인터넷에서 공개적으로 사용할 수 있는 이미지이미지 설명으로 구성되며, 웹스크래핑(Webscraping)이나 웹크롤링(Webcrawling)을 통해 자동으로 다운로드된다.

예를 들어 비영리 단체인 LAION은 텍스트 및 이미지 데이터 세트인 Laion-5BLaionV-400M을 제공하며, 여기에는 각각 인터넷에 저장된 585천만 개와 4억 개의 이미지에 대한 URL과 이미지 설명을 위해 각 웹사이트에 저장된 대체 텍스트’(alt text)가 포함되어 있다. LAION 데이터 세트에 연결된 데이터는 Stable Diffusion의 학습에 사용되었다. 일부 모델에 따라 특정 아티스트의 스타일로 이미지가 명시적으로 제공되거나 사용자가 직접 이미지를 편집할 수 있도록 필터가 앱 스토어를 통해 제공되고 있다. LensaAI의 경우 모델이 생성된 이미지에 인간 아티스트의 서명을 통합한 사례도 보고되고 있다.

20231Getty Images는 런던에서 이미지의 불법 복제 및 처리에 대해 Stability AI를 상대로 소송을 제기했다. 미국에서는 같은 달 세 명의 아티스트가 Stability AI, DeviantArt, Midjourney를 상대로 소송을 제기했다. 원고들은 AI 모델에 학습 데이터 세트의 이미지 압축 사본이 포함되어 있으며 이러한 점에서 MP3, AAC, JPEG 파일과 비교한다고 주장하고 있다. 이에 대해 피고들은 모델의 기술적 기능은 이에 해당하지 않는다는 항변하고 있다.

그동안 인공지능이 생성한 이미지가 저작권으로 보호받을 수 있고 보호할 가치가 있는지에 대해 저작권 관련 문헌에서 심도 있게 다루어졌다. 하지만 인공지능이 이미지를 학습하는 과정에서 발생하는 저작권 침해 문제에 대해서는 아직 충분히 논의되지 않았다. 인공지능의 학습, 사용 및 배포, 그리고 생성이미지의 사용에 대한 저작권 평가의 핵심은 인공지능이 학습 데이터 세트에서 이미지의 사본을 포함하고 있는지 또는 생성할 수 있는지에 대한 질문이다. 이 질문은 인공지능 모델의 기술적 기능을 충분히 고려해야만 답할 수 있다.

기술적 관점에서 보면 여기서 문제가 되는 인공지능은 생성모델이다. 생성모델이 이미지를 학습하는 과정에서 지금까지 알려진 기술로는 저작물의 복제 또는 추출이 발생한다. 따라서 인공지능의 이미지 학습과정은 저작권 침해와 관련될 수 있다. 하지만 인공지능의 공익적 측면을 고려하면 인공지능의 학습과정에서 발생하는 이러한 저작권 침해(주로 복제권) 문제는 저작권의 예외 또는 제한 조항을 도입하여 어느 정도 해결할 수 있다. 이와 관련된 저작권 제한 사유가 바로 소위 텍스트 및 데이터 마이닝’(Text and Data Mining, 이하 ‘TDM’)이다. 유럽연합(EU)DSM 지침((EU) 2019/790)을 통해서 TDM에 의한 예외 및 제한 사유를 도입하여 현재 각 회원국에서 국내법으로 이행하여 적용하고 있다. 따라서 EU에서는 인공지능학습에서 발생하는 복제는 일반적으로 TDM 제한 조항에 따라서 허용된다. 하지만 DSM 지침의 입법자는 최근 등장한 생성형 AI는 염두에 두지 않았다. DSM 지침 당시에는 지난해 출시된 생성형 AI를 전혀 예측하지 못했기 때문이다. 따라서 구체적인 사례에서 인공지능학습이 이러한 TDM 구성요건을 충족하는지 여부가 논의되고 있다. 미디어 제공업체와 출판사는 이미지 인식 알고리즘의 작동 방식으로 인해 저작권이 침해되고 있다고 느끼고 있다. 독일에서도 이와 관련하여 현재 소송이 진행 중이다. 이 소송은 로베르트 크네슈커(Robert Kneschke)라는 스톡(Stock) 사진작가가 2023427일 대규모 AI 시스템 학습 데이터에서 자신의 사진을 삭제해 달라고 비영리 단체인 LAION을 상대로 함부르크 지방법원에 제기한 사건이다.

아래에서는 EU 저작권 지침과 독일 저작권법에서 저작권 제한사유로서 도입된 TDM 조항을 소개하고 독일에서 현재 소송이 진행 중인 사건을 간략하게 검토해 본다.

 

2. EU DSM 지침과 TDM

EU디지털 단일시장 지침이라 불리고 있는 DSM 지침은 보호 콘텐츠의 디지털 이용과 국경을 초월하는 이용을 특별히 고려하여 저작권과 저작인접권에 적용 가능한 유럽연합법을 역내 시장의 체계내에서 조정을 강화하고, 라이선스의 촉진과 관련하여 저작권과 저작인접권의 예외 및 제한을 정하며, 저작물과 저작인접물의 이용을 위해 잘 작동하는 시장을 보장하는 것을 목적으로 2019417일 제정되어 66일부터 발효되었다. 이 지침은 2년의 경과규정에 따라 202167일까지 회원국의 국내법으로 이행되었다. DSM 지침은 두 가지 종류의 텍스트 및 데이터 마이닝을 도입하고 있다. 하나는 과학적 연구 목적(3)이고, 다른 하나는 일반적 목적(4)TDM이다.

(1) TDM의 도입 배경

 

TDM은 이미 정보사회저작권지침(2001/29/EC)에 그 법적 근거를 두고 있다. 이 지침 제5조 제3(a)에 따르면 수업에서 설명하기 위해서(=교육목적) 또는 과학적 연구를 위해서(=과학 연구 목적) 복제권 및 배포권의 예외 또는 제한을 규정할 수 있다. 다만, 이것이 가능해야 되고, 비상업적 목적을 추구해야 하며, 가능한 한 저작자의 이름을 포함한 출처를 표시해야 한다. 이 조항의 과학적 연구 목적은 TDM에도 적용될 수 있다. 그런데 이 조항은 임의적 성격이어서 회원국이 국내법으로 반드시 이행할 의무는 없다.

따라서 이 지침 제5조 제3(a)는 현재의 인공지능학습에 적용하기 어려운 문제점이 있다. 예를 들어 출판물의 구독이나 오픈 액세스 라이선스를 통해 연구자들이 콘텐츠에 합법적으로 접근한 경우, 그 라이선스 조건이 TDM을 배제할 수도 있기 때문이다. 오늘날의 연구는 점차 디지털 기술의 도움을 받아 수행되고 있으므로, EU 입법자는 TDM을 위해 법적 불확실성을 해결하기 위한 조치를 취하지 않는다면 유럽연합의 연구 분야에서의 경쟁적 지위가 손상될 위험이 있다고 진단하고 있다. 따라서 EU 입법자는 대학 및 기타 연구기관은 물론 문화유산기관에도 복제권 및 데이터베이스로부터의 추출 금지권에 대한 강행적인 예외를 도입함으로써 TDM과 관련한 법적인 불확실성을 해결하고 있다.

 

(2) TDM개념

DSM 지침 제2조 제2항은 TDM의 개념을 정의하고 있다. 이에 따르면 텍스트 및 데이터 마이닝이란 패턴, 트렌드 및 상관관계 등의 정보를 생성하기 위해 디지털 형태의 텍스트와 데이터를 분석하는 것을 목적으로 하는 모든 자동화된 분석 기술을 말한다.

지침의 TDM 개념에서 데이터의 분석이 핵심임을 알 수 있다. TDM의 전체 과정을 단순화해 보면 데이터 수집 → ② 디지털화 및 텍스트 추출 → ③ 데이터보관 → ④ 데이터분석 및 경우에 따라 시각화하는 4단계로 구분할 수 있다. 데이터를 분석하기 위해서는 데이터 수집, 텍스트 추출, 데이터보관이 반드시 수반된다. 따라서 TDM 개념에는 데이터 분석을 위한 준비과정도 포함되는 것으로 보아야 한다. 실제로 이러한 준비과정에서 저작권법의 복제가 발생하기 때문이다.

 

(3) 일반적 목적의 TDM(DSM 지침 제4)

 

1) 규정

DSM 지침 제4

(1) 회원국은 텍스트 및 데이터 마이닝을 목적으로 합법적으로 접근 가능한 저작물과 그 밖의 보호대상의 복제와 추출을 위해 데이터베이스지침 제5(a)와 제7조 제1, 정보사회저작권지침 제2, 컴퓨터프로그램지침 제4조 제1(a)(b) 그리고 이 지침 제15조 제1항에 규정된 권리에 대한 예외와 제한을 규정한다.

(2) 1항에 따라 만들어진 복제물 및 추출물은 텍스트 및 데이터 마이닝 목적으로 필요한 경우 보관(=)할 수 있다.

(3) 1항에 규정된 예외와 제한은, 콘텐츠가 온라인에 공개되어 있는 경우, 권리보유자가 제1항에 언급된 저작물과 그 밖의 보호대상을 적절한 방법으로, 가령 기계가 읽을 수 있는 방법으로 사용유보를 명시적으로 설정하지 않는 한에서 적용된다.

(4) 이 조항은 이 지침 제3조의 적용에 영향을 미치지 않는다.

 

2) 설명

DSM 지침은 TDM을 위해서 합법적으로 접근 가능한 저작물과 그 밖의 보호대상의 복제와 추출을 모든 사람에게 허용하고 있다. 이를 위해서 회원국은 EU의 개별 지침에 도입되어 있는 복제권 등에 대한 예외 및 제한에 관한 규정을 도입해야 한다. 따라서 이 조항은 강제적 성격이다. DSM 지침이 언급하고 있는 개별 지침은 데이터베이스지침(96/9/EC), 정보사회저작권지침(2001/29/EC), 컴퓨터프로그램지침(2009/24/EC), DSM 지침((EU)2019/790)이다. 따라서 개별 지침들이 규정하고 있는 복제권 등에 대한 예외 및 제한조항을 도입해야 한다. 구체적으로 데이터베이스지침의 경우 데이터베이스 제작자의 데이터베이스의 표현에 대한 일시적 또는 영구적 복제권(5(a))과 데이터베이스 내용의 추출 및 재이용 금지권(7조 제1), 정보사회저작권지침의 경우 저작자 및 저작인접권자의 복제권(2), 컴퓨터프로그램지침의 경우 컴퓨터프로그램 저작자의 복제권 등(4조 제1(a)(b)), DSM 지침의 경우 언론출판(=간행)물의 이용권(15조 제1)에 대한 예외 및 제한이다.

TDM을 통해서 생산된 복제물과 추출물은 TDM 목적을 위해서 필요한 경우 보관될 수 있다. 콘텐츠가 온라인으로 공중에게 제공되는 경우 권리보유자는 이러한 콘텐츠가 TDM에 이용되지 못하도록 기계가 판독할 수 있는(=읽을 수 있는) 방법으로 적절한 조치를 취할 수 있다. 이러한 조치에는 현재 ‘robots.txt’ 파일이 이용되고 있다. 따라서 TDM은 권리보유자가 이러한 사용유보를 명시적으로 하지 않은 경우에만 가능하다. 하지만 제4조의 일반적 목적의 TDM은 제3조의 과학적 연구 목적의 TDM에는 영향을 미치지 못한다. 따라서 제4조의 유보조항은 제3조에는 적용되지 않는다.

 

(4) 과학적 연구 목적의 TDM(DSM 지침 제3)

 

1) 규정

DSM 지침 제3

(1) 회원국은 연구기관과 문화유산기관이 과학적 연구 목적으로 합법적으로 접근할 수 있는 저작물이나 그 밖의 보호대상에 대한 텍스트 및 데이터 마이닝을 수행하기 위해, 데이터베이스보호지침 제5(a)와 제7조 제1, 정보사회저작권지침 제2조 및 이 지침 제15조 제1항에 규정된 복제권 및 추출권에 대한 예외를 규정한다.

(2) 1항에 따라 만들어진 저작물이나 그 밖의 보호대상의 복제물 및 추출물은 적절한 보안조치를 갖추어 저장되어야 하고, 연구결과의 검증을 포함하여 과학적 연구 목적을 위해 보관될 수 있다.

(3) 권리보유자들은 저작물이나 그 밖의 보호대상이 호스팅되어 있는 네트워크와 데이터베이스의 보안과 무결성을 보장하기 위한 조치를 취할 수 있어야 한다. 그러한 조치는 그 목적을 달성하는 데에 필요한 정도를 넘어서는 안 된다.

(4) 회원국은 권리보유자, 연구기관 그리고 문화유산기관이 제2항과 제3항에 언급된 의무와 조치의 이행에 관하여 통상적으로 합의된 최적 관행을 정의하도록 권장하여야 한다.

 

2) 설명

DSM 지침 제3조의 TDM과학적 연구 목적에 적용된다. 이러한 의미에서 DSM 지침 제4조와의 관계에서 특별규정의 성격을 가진다.

DSM 지침은 TDM의 수행 주체로서 연구기관과 문화유산기관을 언급하고 있다. 연구기관은 DSM 지침 제2조 제1항에 정의되어 있다. 이에 따르면 연구기관이란 일차적인 목적이 과학적 연구를 수행하거나 과학적 연구의 수행과 관련된 교육활동을 수행하는 대학, 연구기관 또는 그 밖의 기관을 말하며, 여기에는 이 기관의 도서관도 포함한다. 이들 기관은 비영리로 운영되거나 모든 이익을 과학적 연구에 재투자하거나 회원국에서 인정하는 공익적 임무에 따라 운영되어야 한다. 또한 연구기관은 민간기업과 파트너십을 통해서 연구를 수행하는 경우에도 TDM 제한조항의 혜택을 받는다. 하지만 민관파트너십 관계에서 민간기업이 과학적 연구로 생성되는 결과에 먼저 접근하거나 해당 연구기관에 결정적인 영향력을 행사하는 경우에는 TDM 조항이 적용되지 않는다. 문화유사기관은 DSM 지침 제2조 제3항에서 정의하고 있다. 이에 따르면 문화유산기관이란 공중이 접근할 수 있는 도서관이나 박물관, 기록보존소나 영화 또는 오디오 유산 기관을 말한다.

연구기관과 문화유산기관은 과학적 연구 목적으로 합법적으로 접근할 수 있는 저작물이나 그 밖의 보호대상을 TDM을 위해 복제하고 추출할 수 있다. 이를 위해서 제4조의 일반적 목적의 TDM과 같이 데이터베이스보호지침, 정보사회저작권지침, DSM 지침의 복제권 등에 대한 예외가 허용된다. 하지만 제4조와 달리 제3조는 컴퓨터프로그램지침을 언급하고 있지 않다. 그럼에도 불구하고 제3조는 특별규정이므로 제4조가 보충적으로 적용되어 컴퓨터프로그램지침도 과학적 연구 목적의 대상이 된다. 또한 제3조는 제4조와 달리 권로보유자의 사용유보가 없다. 따라서 제4조의 유보조항은 컴퓨터프로그램지침에는 적용되지 않는 것으로 보인다. 또한 제3조는 복제권 및 추출권의 예외만 언급하고 제한을 언급하지 않았다. 하지만 이것은 법전편찬상의 오류로 보인다.

연구기관이나 문화유사기관은 TDM을 통해서 생산한 저작물이나 그 밖의 보호대상의 복제물을 적절한 수준의 보안을 갖추어 보관해야 한다. 또한 연구결과의 검증 등 과학적 연구 목적을 위해서도 보관할 수 있다.

권리보유자들은 저작물이나 그 밖의 보호대상이 호스팅되어 있는(=저장되어 있는) 네트워크와 데이터베이스의 보안과 무결성을 보장하기 위한 조치를 취할 수 있어야 한다. 하지만 그러한 조치는 그 목적을 달성하는 데에 필요한 수준을 넘어서는 안 된다.

또한 회원국은 권리보유자, 연구기관, 문화유산기관이 자신들에게 부과된 의무와 조치를 이행할 때 통상적으로 합의된 최적 관행을 정의하도록 권장하여야 한다.

한편 제3조의 TDM 예외와 배치되는 계약은 집행될 수 없다(DSM 지침 제7조 제1). 또한 정보사회저작권지침의 제한 및 예외의 3단계이론은 제3조와 제4조에도 적용되어야 한다. TDM은 일반적으로 DSM 지침 제6조의 유효한 기술적 조치와 충돌한다. 따라서 제3조와 제4조의 TDM에는 이러한 기술적 조치가 배제될 수 있다(DSM 지침 제7조 제2).

 

3. 독일 저작권법의 TDM

(1) 개관

독일 입법자는 ‘201791일자 저작권 지식사회법’(UrhWissG)에서 TDM을 처음 도입하였다. 이 법에 따라 저작권법 제60d조에 과학적 연구 목적의 TDM이 추가되었다. 이 당시 EU집행위원회가 DSM 지침 초안을 이미 제안한 상태였다. 따라서 2017년 저작권법 제60d조는 이 초안과 정보사회저작권지침 제5조 제3(a)를 토대로 하고 있다. 그 후 DSM 지침이 제정되어 회원국은 이를 국내법으로 이행해야 했다. 독일에서는 DSM 지침의 이행 법률인 ‘2021531일자 디지털 역내시장의 요구사항에 저작권을 적응시키기 위한 법률을 통해서 DSM 지침 제4조는 저작권법 제44b조에서, DSM 지침 제3조는 저작권법 제60d조에서 각각 이행되었다. 특히 DSM 지침 제3조는 과학적 연구 목적의 TDM에 대한 특별 요건임을 명시하고 있다. DSM 지침 제3조는 EU집행위원회 초안 제3조와 내용이 달라졌기 때문에 저작권법 제60d조는 DSM 지침 제3조의 요건을 준수하기 위해서 기존 제60d조를 대체하였다. 그리고 DSM 지침은 기존의 EU 저작권 지침의 효력에 영향을 미치지 않기 때문에 저작권법 제60d조에 대한 EU법의 근거는 여전히 정보사회저작권지침 제5조 제3(a)의 예외 및 제한 조항이다.

 

(2) TDM의 개념

TDM의 법적 개념은 저작권법 제44d조에서 정의하고 있다. 이에 따르면 TDM은 특히 패턴, 트렌드 및 상관관계에 관한 정보를 얻기 위해 개별 또는 다수의 디지털 저작물 또는 디지털화된 저작물을 자동으로 분석하는 것이다(1). TDM의 법적 개념에 디지털 저작물 외에 디지털화된 저작물을 포함시키고 있다. 이것은 분석 대상 자료가 원본 디지털 소스뿐만 아니라 처음에는 아날로그였다가 이후에 TDM의 목적으로 디지털화된 소스에서도 나올 수 있음을 의미한다. 이는 이 기술적 방법의 활용과 실현 가능성을 고려할 때 합리적이고 필요한 조치로 보인다. 왜냐하면 저작권법의 TDM의 경우 저작물의 형태와 관계없이 결정적인 요소는 포함된 사실 정보, 즉 보호 대상 저작물에 구현된 정보 가치를 평가할 수 있는 가능성이기 때문에 아날로그 저작물을 제외할 이유가 없기 때문이다.

저작권법 제60d조와 마찬가지로 제44b조는 개별 저작물의 유형을 제한하지 않는다. , 컴퓨터 프로그램(69a조 제4), 데이터베이스(87c), 저작인접물의 보호대상(예를 들어 제70조의 학술 판본, 71조의 유작저작물, 72조의 저작인접물로서 보호받는 사진, 95조의 동영상, 85조 이하의 음반, 방송 등)이 특히 TDM의 대상이 될 수 있다. 물론 보호되지 않는 콘텐츠도 TDM의 목적으로 복제될 수 있다. 이러한 콘텐츠는 저작권법상 보호 대상이 아니기 때문에 일반적으로 자유롭게 사용할 수 있으므로 저작권법상 금지 규정이 없는 한 제한조항에 의한 정당성이 요구되지 않는다. 하지만 이러한 콘텐츠는 인격권, 개인정보보호법, 비밀보호관련 법규에 따라 제한될 수 있다.

개별 또는 다수의 저작물이라고 표현하고 있으므로 다수의 저작물을 동시에 분석할 수 있다. 자동화된 분석은 특히 패턴, 추세 및 상관관계에 대한 정보를 얻기 위한 목적으로 사용될 수 있다. 동시에 자동화된이라는 용어는 콘텐츠가 수동으로 처리될 수 있을 뿐만 아니라, 컴퓨터로도 처리될 수 있음을 명확히 한 것이다.특히라는 문언은 이 목록이 최종이 아니며 다른 목적도 가능하다는 점을 분명히 한다(DSM 지침 제2조 제2호 참조). 일반적인 방법은 알고리즘이 행동, 과정 및 사실에 대한 정보를 얻기 위해 특정 기준에 따라 매우 많은 양의 데이터를 검색하는 것이다. 이러한 접근 방식은 특히 타겟 그룹 마케팅, 사기 탐지 또는 AI 학습 등에 유용하다.

 

(3) 일반적 목적의 TDM(저작권법 제44b)

1) 규정

44b(텍스트 및 데이터 마이닝)

(1) 텍스트 및 데이터 마이닝은 개별 또는 다수의 디지털 저작물 또는 디지털화된 저작물에서 특히 패턴, 트렌드 및 상관관계에 관한 정보를 생성하기 위해서 이들을 자동으로 분석하는 것이다.

(2) 텍스트 및 데이터 마이닝을 위해 합법적으로 접근 가능한 저작물의 복제는 허용된다. 그 복제가 텍스트 및 데이터 마이닝에 더 이상 필요하지 않은 경우 삭제해야 한다.

(3) 2항 제1문에 따른 사용은 권리자가 이를 유보하지 않은 경우에만 허용된다. 온라인에서 접근 가능한(=이용제공된) 저작물의 경우 사용유보는 기계가 읽을 수 있는(=판독할 수 있는) 형태로 수행된 경우에만 효력이 있다.

 

2) 설명

허용되는 이용행위

첫째, TDM은 권리보유자의 허락이 필요하지 않다.

TDM 또는 이에 필요한 순수 사실 정보의 자동화된 분석 그 자체는 저작권 관련 행위가 아니다. 그러나 자동화된 분석을 준비하기 위해 수행되는 행위 및 보호 대상 저작물의 사용과 관련된 행위는 저작권법과 관련이 있다. 이러한 배경에서 이후에 알고리즘적으로 분석될 데이터 코퍼스(data korpus)를 구성하는 행위는 관련 행위로 분류될 수 있다. 이는 저작권으로 보호되는 저작물이 이러한 목적으로 분석 가능한 디지털 사본으로 변환되는 경우가 많기 때문이다. 이러한 변환은 일반적으로 저작권법 제16조의 복제를 통해 이루어진다. 따라서 제44b조의 제한은 본질적으로 이 행위와 관련이 있다. 물론 다른 제한 조항, 예를 들어 저작권법 제51조의 인용권에 따라 추가 사용이 허용될 수도 있다.

 

둘째, 합법적으로 접근 가능한 저작물의 복제행위.

저작권으로 보호되지 않는 텍스트, 데이터, 이미지 및 기타 자료의 복제는 일반적으로 허용된다. 보호 기간이 만료된 이른바 퍼블릭 도메인 저작물(64)과 고아 저작물(61)도 자유로이 이용될 수 있다. 복제는 자동화된’, 즉 컴퓨터를 이용하여 체계적으로 복제될 수 있다. 이는 콘텐츠가 저장 매체에 구조적으로 저장될 수도 있음을 의미한다.

온라인 검색이 가능한 콘텐츠가 기술적 보호 조치에 의해 복제되지 않도록 보호되어 있는 경우, 이러한 보호 조치는 저작권법 제95b조 제3항 때문에 우회될 수 없다.

44b조는 제2조의 보호 저작물, 3조의 개작물, 기타 저작권법에 의해서 보호되는 보호대상[예컨대 학술판본(70조 제1), 공공 영역의 저작물(71조 제13), 사진(72조 제1), 영상 및 음반(83, 85), 동영상(95)]을 포함한다. 문언에 따르면 사용하려는 저작물이 이미 공표되었는지 여부는 중요하지 않다. 컴퓨터프로그램은 제69c조 제2항에 따라 제44b조의 TDM에도 사용될 수 있다(69d조 제4). 유형 또는 범위 측면에서 데이터베이스의 상당 부분을 복제하는 것은 제44b조의 TDM 목적으로 허용된다(87c조 제1항 제4).

허락은 합법적으로 접근할 수 있는 저작물의 복제로 제한된다. 저작물에 대한 접근은 일반적으로 원하는 사용 목적에 대한 라이선스가 있거나 인터넷 등을 통해 자유롭게 접근할 수 있는 경우 합법적이다. 이 경우 자유로운 접근을 판단하기 위해서는 외부에서 인식할 수 있는 저작자 또는 권리보유자의 의도에 의해 배제되는지 여부를 고려해야 한다. 요컨대, 콘텐츠가 저작자의 의사와 무관하게 또는 적어도 저작자의 의사에 반하여 인터넷에 게시되었다는 것을 일반인이 인식할 수 정도로 명백한 경우 그 접근은 불법으로 간주될 수 있다.

 

인공지능 관련

TDM은 본질적으로 인공지능(AI)의 사용을 기반으로 한다. 데이터 분석 목적의 AI 도구 사용과 AI를 이용한 컴퓨터프로그램의 검증 및 프로그래밍은 중요한 의미를 지닌 애플리케이션 시나리오로 빠르게 발전하고 있다. 이 경우 다양한 법적 문제가 고려될 수 있다. 왜냐하면 AI를 사용할 때 TDM을 하는 사람은 영업비밀, 개인정보보호, 3자의 재산권과 같은 기밀 정보를 보호해야 하기 때문이다. 준수해야 할 법률에는 특히 마이닝할 텍스트 및 데이터와 관련된 개인정보보호법, 비밀보호관련 법규, 경쟁법 및 저작권법이 포함된다. 이는 특히 머신 러닝에 의존하거나 구조적으로 머신 러닝에 의존할 수 있는 기능 및 특징에 적용되지만 이에 국한되지 않는다.

데이터 분석 목적으로 AI 도구를 사용하는 경우, 저작권법의 관점에서 AI가 마이닝(=채굴)된 저작물에 합법적으로 접근할 수 있는지 여부가 중요하다. 이 경우 준비행위로서 순수한 인공지능 학습용 데이터인지, 의도한 이용목적의 실제 데이터 분석인지는 중요하지 않다. 엄밀히 말하면 순수 인공지능 학습은 후속 분석을 위한 준비행위에 불과하여 간접적으로 정보를 획득하는 역할에 불과하지만, 동시에 인공지능학습은 데이터 말뭉치(=코퍼스)의 불일치뿐만 아니라 패턴과 상관관계를 인식할 수 있어야 하는 인공지능의 유용성 및 작동 능력을 위한 필수 전제조건이다. 44b조의 목적론적 해석에 따르면 이러한 필수 준비 행위도 규범의 적용을 받는 것으로 간주되어야 한다. AI를 사용하기 전에 채굴 대상 저작물의 권리보유자가 적절한 형식으로 TDM에 대한 유보를 선언하지 않았는지 확인해야 한다.

분석 결과 자체도 문제가 될 수 있다. 저작권법은 인간이 창작한 결과물만 보호하기 때문이다(저작권법 제2조 제2). 순전히 인공지능이 생성한 저작물은 현재의 법적 상황에 따라 공적 영역에 속하는 것으로 분류해야 한다. TDM을 실행한 인간은 기본적으로 분석 결과에 대한 법적 소유권을 갖지 않으며 저작권법에 따라 유료 라이선스에 대한 권리를 주장할 수 없다. 현재까지 독일 또는 유럽 법원이 AI가 생성한 결과에 대한 인간의 기여도를 어느 정도까지 인정할 것인지에 대한 문제를 다루지 않았다. 어쨌든 저작권 보호를 받기 위해서는 분석 결과가 인간의 초기 아이디어에만 기반한다는 것만으로는 충분하지 않다. 저작권을 인정하는 데는 원인야기원칙이 아니라 창작원칙이 결정적이기 때문이다. 이러한 배경에서 분석 결과는 인간의 공동 창작(, 개인의 지적 기여가 큰 경우)에 의해 구체화되어야 한다. , TDM을 수행한 사람이 전체 분석 과정에 걸쳐 자신의 아이디어를 가지고 지적으로 참여해야 하며, 분석 결과의 종합적인 생성을 인공지능에 맡겨서는 안 된다.

인공지능의 이용목적이 텍스트 및 데이터를 분석하는 것이 아니라 오류를 확인하고 컴퓨터프로그램을 분석하는 것이라면, 프로그램 코드를 작업 메모리에 로드하고 알고리즘을 사용하여 평가함으로써 인공지능 훈련과 후속 코드 분석 과정에서 프로그램 코드를 정기적으로 복제한다. 이 경우 컴퓨터프로그램에 대한 특별 제한 조항이 우선적으로 적용되어야 한다.

 

삭제 의무

생성된 복제물은 TDM을 위해서 필요한 기간 동안 복제 및 저장할 수 있다. 그렇지 않으면 삭제해야 한다. 그런데 언제 그 필요성을 확인해야 하는지는 입법이유에서 명확하지 않다. 하지만 DSM 지침 제4조 제2항은 TDM 목적을 위해 필요한 기간 보관할 수 있다고 명시하고 있다. 44b조 제2항 제2문은 DSM 지침 제4조 제2항을 이행한 것이므로 이와 같이 해석해야 한다.

60d조는 보관과 관련하여 과학적 연구 및 그 결과의 검증을 목적으로 하고 있다. 이에 반해서 제44b조는 데이터 마이닝 자체를 위해서만 보관하고 있다는 점에서 차이가 있다. 44b조의 문언을 좁게 해석하면 정보값이 이미 완전히 자동으로 분석된 경우 사본은 더 이상 준비 데이터 코퍼스로서 필요하지 않을 것이라는 결론이 도출될 수 있다. 하지만 이러한 관점은 TDM 행위에만 초점을 맞추고 있다. 이는 현실과 부합하지 않을 뿐만 아니라 민간 부문의 혁신을 촉진하려는 제44b조의 입법 취지에도 부합하지 않는다. 이는 정확성 및 완전성 기준과 같은 이행의 품질 관리를 고려하지 않기 때문이다. 따라서 정보값을 분석한 후, TDM 과정이 완료된 후에도 2, 3차 또는 후속 분석이 필요한 오류가 발생할 가능성을 배제할 수 없다. 동시에 연구의 경우 텍스트 및 데이터 마이닝은 일반적으로 순수한 정보 획득에만 사용되는 것이 아니라 항상 얻은 결과의 신뢰성에 대한 증거를 필요로 한다. 따라서 각 연구 작업의 기간과 검증 요건은 매우 중요하다. 따라서 연구 결과를 검토할 수 있는 기간은 항상 사례별로 평가되어야 한다.

 

사용 유보

권리보유자는 사용 유보를 통해 자신의 저작물이 상업적 목적으로 텍스트 및 데이터 마이닝을 위해 복제되지 않도록 규정할 수 있다. 44b조는 보상 지급 의무를 규정하고 있지 않다. 그러나 입법자는 제3항의 사용 유보를 통해 보상이 없는 사용 행위에 대해서 대가를 받고 라이선스를 부여할 수 있는 가능성을 열어 두고 있다.

입법이유에 따르면, 사용 유보는 명시적으로 선언되어야 한다. 따라서 아날로그 저작물의 경우 사용 유보는 너무 많은 노력을 들이지 않더라도 쉽게 알 수 있어야 한다. 온라인으로 접근 가능한 저작물의 경우 사용 유보는 기계가 읽을 수 있는 형식이어야 한다. 이를 위반하면 사용 유보는 효력이 없다. 저작물의 권리자가 새로운 사용 유보를 추가하는 경우, 이 시점부터 적용된다.

또한 저작권법 제95b조의 기술적 보호조치와 관련하여 권리보유자는 필요한 범위 내에서 권리를 이용할 수 있도록 제44b조에 의한 수혜자(TDM 권리자)가 저작물 또는 보호 대상에 합법적으로 접근할 수 있는 한 필요한 수단을 제공해야 한다.

 

(4) 과학적 연구 목적의 TDM(저작권법 제60d)


1) 규정

60d(과학적 연구 목적의 텍스트 및 데이터 마이닝)

(1) 텍스트 및 데이터 마이닝을 위한 복제(저작권법 제44b조 제1항 및 제21)는 다음 조항에 따라 과학 연구 목적으로 허용된다.

(2) 연구 기관은 복제할 권한이 있다. 연구 기관은 대학교, 연구소 또는 과학 연구를 수행하는 기타 기관으로,

1. 상업적 목적을 추구하지 않거나

2. 모든 수익을 학술 연구에 재투자하거나

3. 국가가 인정한 위임의 범위 내에서 공익을 위해 활동하는 경우에 한한다.

연구기관에 결정적인 영향력을 행사하고 학술연구 결과에 우선적으로 접근하는 민간 기업과 협력하는 연구기관은 제1문에 따른 권리가 없다.

(3) 다음 각 호에 해당하는 자도 복제할 권한이 있다.

1. 공중이 이용하는 도서관 및 박물관, 영화 또는 오디오 유산 분야의 아카이브 및 기관(문화 유산 기관)

2. 상업적 목적을 추구하지 않는 경우의 개인 연구자.

(4) 상업적 목적을 추구하지 않는 제2항 및 제3항에 따른 권리자는 제1항에 따른 복제물을 다음 각 호에 해당하는 자에게 공중접근시킬(=이용제공할) 수 있다.

1. 공동과학연구를 위해 특별히 한정된 분야의 사람들.

2. 과학연구의 품질을 검증하기 위한 개별 제3.

공동과학연구 또는 과학연구결과의 품질 검증이 완료되는 즉시 공중접근은 종료한다.

(5) 2항 및 제3항 제1호에 따른 권리자는 과학연구목적 또는 과학적 연구결과의 검증을 위해 필요한 동안 제1항에 따른 복제물을 보관할 수 있으며 이 경우 무권한 이용에 대해 적절한 안전조치를 마련해야 한다.

(6) 권리보유자는 제1항에 따른 복제로 인해 네트워크 및 데이터베이스의 보안과 무결성이 위태롭게 되는 것을 방지하기 위해 필요한 조치를 취할 권한이 있다.

 

2) 설명

 

특별규정의 도입 목적

과학적 연구 목적의 TDM 조항은 텍스트 및 데이터 마이닝을 분석하는 기술적 방법에서 발생하는 잠재력을 과학적 연구 목적으로 활용하기 위한 것이다. 동시에 이 제한 조항은 학문의 자유와 권리보유자의 사용 이익 사이에 상충되는 이해관계에 균형을 맞추기 위한 것이다.

 

허용되는 이용행위

40b조와 마찬가지로 제60d조의 경우에도 TDM에는 허락이 필요하지 않다. 그리고 합법적으로 접근 가능한 저작물을 복제할 수 있다. 하지만 제60d조 제1항은 과학적 연구 목적으로 제한된다. 여기서 과학이란 자연과학과 인문과학을 모두 포함하는 상위개념이다. 인공지능과 관련한 내용은 제40b조와 동일하다.

 

TDM 수행 권리자의 범위

60d조는 과학적 연구 목적으로 TDM을 수행할 수 있는 권리자의 범위를 세가지 범주로 나누고 있다. 세가지 범주는 연구기관, 문화유산기관, 개인 연구자이다.

 

TDM을 위해서 복제할 권한이 있는 연구기관은 대학교, 연구소 또는 과학연구를 수행하는 기타 기관이다. 과학연구를 수행하는 기타 기관에는 예를 들어 연구클리닉도 포함될 수 있다.

하지만 연구기관은 상업적 목적을 추구하지 않아야 하고, 모든 수익을 학술 연구에 재투자하거나 국가가 인정한 위임의 범위 내에서 공익을 위해 활동하는 경우에 한한다. 디지털화된 자료에 대한 접근 및 제공 비용을 지불하는데 그치는 경우 분석 결과에 대한 접근 수수료를 부과하는 것은 비상업적 목적의 추구를 배제하지 않는다. 연구 기관이 상업적 목적을 추구하지만, 모든 수익을 과학 연구에 재투자하는 경우, 제한특권이 긍정될 수 있다. 여기에는 단순히 비용을 충당하는 것이 아니라 수익을 창출하는 분석 결과에 대해 접근비용을 부과하지만, 이러한 수익금을 연구에 재투자하는 경우도 포함된다. 이것은 항상 사례별로 평가되어야 한다. 또한 국가가 공익을 위해 인정한 위임도 제한특권이 적용될 수 있다. 이러한 위임은 연구 활동이 공공 부문에 의해 재정 지원을 받거나 국내법 또는 공공 계약의 해당 조항에 근거하는 경우 존재한다. 실제로 연구기관은 컨설팅 또는 지원 서비스를 제공하거나 TDM 또는 그 일부의 기술적 구현을 의뢰하기 위해 외부 서비스 제공업체를 이용할 수 있다. 따라서 이러한 대리인의 행위도 이 제한특권에 포함된다.

 

또한 제60d조 제2항 제3문은 민간기업과의 관계에서 소위 민관 파트너십이라고 하는 제한특권을 명시적으로 규정하고 있다. 민관 파트너십은 연구기관이 민간 기업과 계약상 협력 관계에 기초하여 협력하고, 무엇보다도 민간 기업의 기술 인프라와 기타 운영 및 작업 자원을 활용할 수 있다는 점이 특징이다. 하지만 이러한 민관파트너십은 민간기업이 연구 기관에 결정적인 영향력을 행사하고, 연구 결과에 우선적으로 접근하는 경우에는 제외된다. 따라서 결정적 영향력의 판단 기준은 민간 기업이 연구 프로젝트의 내용과 구조 및 연구 대상의 범위에 대해 일방적으로 통제권을 행사할 수 있는지 여부가 될 것이다.

 

문화유산기관도 과학적 연구 목적으로 TDM을 수행할 수 있다. 이러한 문화유산 기관에는 공중에게 공개되는 경우 도서관과 박물관은 물론 아카이브와 영화 또는 오디오 유산 기관도 포함된다. 여기에는 국립도서관, 국립기록보관소, 공공 서비스 방송 기관도 포함된다.

개인연구자도 TDM과 관련하여 상업적 목적을 추구하지 않는 한 제한특권을 가진다. 이러한 개인 연구자에는 대학교수, 연구조교 또는 박사 과정 학생뿐만 아니라 과학 분야(: 학사 및 석사 학위 논문 준비)에 종사하는 학생과 개인 학자도 포함될 수 있다. 모든 사람의 권리인 학문의 자유의 관점에서 개인의 연구가 영리를 목적으로 수행되지 않는 경우, 즉 상업적으로 수행되지 않는 경우 제60d조의 연구자와 권리보유자 간의 상호 이익의 균형이 유지되는 것으로 보인다.

 

복제물의 공중접근(=공중 이용제공 또는 전송)

연구기관, 문화유사기관, 개인 연구자는 생성된 디지털화된 자료를 다른 사람에게 공중 접근시킬 수 있다(60d조 제41). 이들에게 복제물을 제공하는 것에는 대화형 검색이 가능하도록 하는 것은 물론 일반적으로 다운로드 옵션 또는 디지털 접근을 통한 단순한 열람도 포함된다. 이들에게 공중접근시키기 전에 기술적으로 필요한 복제는 저작권법 측면에서 독립적인 의미를 갖지 않으므로 허용된다.

TDM이 허용된 권리자는 자신의 재량에 따라 공중접근을 위해서 다운로드 옵션 또는 단순 보기(읽기 전용) 중 어느 것이 바람직한지 여부를 결정한다. 이용자의 범위 확대는 이용 목적에 달려 있다.

이러한 이용자 범위는 공동 과학 연구를 위한 특정한 그룹의 사람과 과학연구의 품질을 검증하기 위한 개별 제삼자이다. 공동 연구에서 이러한 이용자 그룹의 확대는 오늘날 학제간 연구 연합 및 연구소의 구성에서 종종 볼 수 있다. 과학연구의 품질을 검증하기 위해 개별 제삼자로 확대한 것은 독립적인 전문가 또는 동료 심사와 같은 공인된 제3자에 의한 독립적인 감사 및 품질 관리의 수행이다. 입법자가 과학 연구 결과의 검증을 포함시킨 것은 우수한 과학적 관행을 보장하는 유일한 방법이기 때문에 매우 환영할 만한 일이다.

이와 같이 확대된 이용자의 공중접근은 공동과학연구 또는 과학연구결과의 품질 검증이 완료되는 즉시 종료해야 한다.

 

복제물의 보관 및 이에 대한 보안조치

연구기관 및 문화유산기관은 TDM으로 생성된 복제물을 과학연구목적 또는 과학적 연구결과의 검증을 위해 필요한 동안 보관할 수 있다. 이 경우 무권한 이용에 대해 적절한 안전조치를 마련해야 한다. 안전한 보관은 제한특권자의 책임이다. 보관은 최신 기술을 기반으로 해야 한다.

복제물은 품질관리의 수행을 포함한 과학 연구 목적으로 TDM을 위해서 제한특권자에게 필요한 경우에만 제작되어 보관할 수 있다. 그렇지 않으면 삭제해야 한다. 언제 그 필요성을 확인해야 하는지는 입법이유에서 명확하지 않다. 44b조와 달리 제60d는 보관권과 관련하여 데이터 마이닝 자체만이 아니라 과학 연구 및 그 검증의 목적도 언급하고 있다. 따라서 각 연구 작업의 기간과 검증의 필요성은 매우 중요하다. 연구 결과를 검증할 수 있는 기간은 항상 사례별로 평가되어야 한다. 독일학술연구재단(DFG) 및 막스플랑크연구재단의 우수한 과학적 관행 보장 가이드라인에서는 10년의 보관 기간을 권장하고 있다.

 

네트워크 및 데이터베이스의 보안 및 무결성 보장 조치

권리보유자는 자신의 재량에 따라 보호 대상 저작물의 무단 사용을 방지하기 위해 저작권법 제95a조에 따라서 기술적 보호조치를 할 수 있다. 하지만 이러한 기술적 보호조치는 저작권법의 제한조항에 따라서 일정한 범위에서 완화되어야 한다. 저작권법 제95b조에 따르면 권리보유자는 저작권법의 제한조항에 따라서 보호저작물이나 보호대상에 합법적으로 접근할 수 있는 자에게 기술적 보호조치에도 불구하고 필요한 범위에서 이들의 접근을 허용해야 할 의무가 있기 때문이다.

저작권법 제95b조에 따른 권리보유자의 의무는 일반적으로 정보보안과 충돌할 수 있다. 왜냐하면 웹사이트, 로컬 또는 클라우드 기반 네트워크 및 네트워크 서비스, 기타 클라우드 기반 정보 처리 시스템 및 데이터베이스 등은 모두 해커의 공격으로부터 보호되어야 하기 때문이다. 이러한 정보보안조치의 목적은 정보처리시스템 및 데이터베이스에 대한 수많은 동시 자동 접근을 방지하는 것이다. 이러한 맥락에서 법적으로 허용되는 TDM 분석을 위한 접근이 실제로 사이버 범죄 활동과 어떻게 구별될 수 있는지 그리고 특히 권리보유자의 동의 없이 실제로 효과적으로 수행될 수 있는지는 의문이 제기된다.

 

(4) 비교

일반적 목적의 TDM과 과학적 연구 목적의 TDM은 아래와 같이 비교할 수 있다.

 

 

44b

60d

성격

일반규정

특별규정

목적

상업적

비상업적, 과학연구

적용대상

모든 사람

연구기관, 문화유산기관, 개인 연구자 등

저작물 유형 제한

X

X

복제물 보관 목적

TDM 자체

TDM 포함. 과학연구 및 그 결과 검증

예외 및 제한 권리

복제권

복제권

복제물의 공중접근

X

O

사용유보

O

X

출처인용

X

X

제한조항 위반 계약 금지

O

O

보상청구권

X

X (60h조 제2항 제3)

 

 

 

4. 현재 소송 중인 Stock 사진 사건의 법적 검토

 

(1) 사실관계

세계 최고의 Stock 사진 에이전시 중 하나인 게티 이미지(Getty Images)6,206,547개의 스톡 사진 및 고해상도 사진을 보유하고 있다. 스톡 사진 전문 영국 회사는 ‘339,800,165개의 스톡 사진, 360° 파노라마 이미지, 벡터 및 동영상을 보유하고 있다.

2023427, 스톡 사진작가 로베르트 크네슈커(Robert Kneschke)는 비영리 단체인 LAION을 상대로 함부르크 지방 법원에 자신의 저작권 침해를 중단해 달라는 소송을 제기했다. 스톡 사진작가는 웹크롤러가 자신 또는 동료의 이미지를 분석할 수 있는 범위를 전체 스톡 사진 업계에 명확히 할 것을 원한다. 또한 사진작가는 대규모 머신 러닝 모델을 훈련하는 데 사용되는 이미지의 저작자가 보상을 받을 수 있도록 영향을 미치기를 원한다.

LAION은 오픈 소스 AI 모델과 데이터 세트를 개발하는 독일의 비영리 단체이다. 설립자들에 따르면, 이 단체는 인공 지능의 민주화를 위해서 존재하며, 주로 연구자들이 새로운 기술에 접근할 수 있도록 하는 것을 목적으로 한다. 무엇보다도 이 협회는 대규모 독점 AI 모델의 복제를 지원하고, 국제 공공 슈퍼컴퓨팅 유닛을 촉구하며, 지난 4월 말 EU 의회에 보낸 공개 서한에서 AI 법의 과잉 규제에 대해 경고한 바 있다. 이와 같이 LAION은 전 세계 회원을 보유한 공익 단체로, 머신러닝을 위한 대규모 모델, 데이터 세트 및 관련 코드를 일반 공중이 사용할 수 있도록 하는 것을 목표로 한다.

LAION의 데이터베이스에는 픽셀 데이터가 아닌 순수 텍스트 데이터, 메타데이터 및 URL이 포함되어 있다고 한다. 제공되는 LAION-400 M LAION-5B 데이터 세트에는 픽셀 데이터가 포함되지 않고 텍스트 데이터, 텍스트 임베딩 및 무료 인터넷에서 사용할 수 있는 이미지-텍스트 쌍에 대한 URL 참조만 포함되어 있다고 한다. 따라서 데이터 세트는 4억 개, LAION-5B의 경우 50억 개의 이미지에 대한 색인 참조를 포함하는 카탈로그이다.

LAION은 자신들의 처리행위가 과학 연구 목적의 TDM인 저작권법 제60d조에 근거할 수 있다는 입장을 취한다. 이에 대해서 사진 작가는 이 단체의 공익성과 연구 목적에 의문을 제기한다. 사진작가는 최근 자신의 블로그에서 Stability AI가 기부금으로 LAION을 재정적으로 지원하고 컴퓨팅 성능을 제공했다고 한다. 이에 대해 LAIONStability AI에 따르면 그 기부금은 소액의 일회성이라고 한다. 사진작가는 또한 공증인의 공증을 거친 사단등기부등본의 발췌본에 따르면, LAION20222월에 공식적으로 비영리 사단법인으로 등록되었으며, LAION-400 M LAION-5B 데이터 세트의 생성은 이미 2021년에 이루어졌다고 주장한다. 따라서 LAION은 등록 이전 기간에 저작권법의 제한조항을 주장할 수 없다고 한다. 사진 작가는 이 단체가 20222월 이전에 이미 존재했다고 의심한다.

 

(2) 법적 검토

이 사건은 저작권법 제44b 또는 제60d조의 요건이 충족되는지, 따라서 단체의 사용이 저작권법에 따라 허용되는지 여부에 대한 의문을 제기한다. 권리보유자가 이 권리를 유보하지 않았고 이 유보가 저작권법 제44b조 제4항 제1문에 따라 기계가 판독할 수 있는 형태로 저장되어 있는 경우 저작권법 제44b조 제3항 제2문에 따른 사용이 가능하다. 그러나 이러한 언급은 발견되지 않는다.

사진 작가는 이 단체의 공익성과 연구 목적에 의문을 제기하고 있다. 그러나 이러한 주장은 몇가지 점에서 의문을 제기할 수 있다. 우선 소위 민관 파트너십의 경우 TDM의 제한특권이 인정되고 있다(저작권법 제60d조 제2항 제3). 이것이 부정되기 위해서는 민간기업이 연구기관에 결정적인 영향력을 행사하고 학술연구 결과에 우선적으로 접근해야 한다. 둘째, 웹크롤러의 사용이 저작권에 영향을 미칠 수 있는지 여부이다.

 

1) 저작권법 관련 행위

이전의 챗봇은 미리 만들어진 답변으로 작동하였다. 이와 달리 현재의 생성형 AI는 미리 만들어진 답변으로 바로 작동하는 것이 아니라, 딥러닝을 통해 독립적이고 새로운 답변을 생성할 수 있다는 점이다. 이것이 생성형 AI와 이전 챗봇의 혁명적인 차이점이다. 특정 아티스트의 스타일로 이미지를 생성하도록 이미지 생성기에 요청하면 프로그램이 단순히 기존 데이터를 복제하지 않는다. 오히려 프로그램은 자체적으로 새로운 독자적인 저작물을 생성한다. 사전에 수행되는 TDM은 작품을 제작하기 전 아티스트의 학습 과정이자 영감에 지나지 않는다. 이러한 학습 및 창작 과정의 결과물이 원본과 지나치게 유사한 경우, 저작권법 제15조 및 제16조에 의한 저작자의 복제권 및 배포권이 침해될 수 있다.

따라서 저작권법 제23조에서 의미하는 개작이 있는지 여부를 평가할 때는 원저작물과 비교하여 원저작물의 독자적인 창작적 특징이 차용되었는지 여부와 차용되었다면 어느 정도 차용되었는지를 판단해야 한다. 이 판단에서 결정적인 요소는 궁극적으로 창작물의 전체적인 인상을 비교하는 것이다. 즉 이러한 맥락에서 차용된 모든 창작적 특징이 전체적인 관점에서 고려되어야 한다. 저작권법 제23조와 관련한 연방대법원의 단계적 심사 순서는 생성형 AI 분야에서 무엇이 쟁점이 되는지를 명확하게 보여주고 있다. 연방대법원의 소위 포르쉐 판결에 따르면 우선 사용된 저작물의 창작적 독창성을 결정하는 객관적인 특징이 무엇인지 구체적으로 판단해야 한다고 한다. 그런 다음 원저작물과 비교하여 새로 형성된 것이 원저작물의 독창적인 창작적 특징을 차용했는지 여부와 차용했다면 어느 정도까지 차용했는지를 판단해야 한다고 한다. 이 판단에서 중요한 요소는 궁극적으로 형성물의 전체적인 인상을 비교하는 것이며, 이 맥락에서 차용된 모든 창작적 특징이 전체적인 관점에서 고려되어야 한다고 한다. 각각의 전체적인 인상이 일치하면 새 형성물은 원저작물을 복제한 것이라고 한다. 그런 다음 필요한 경우 새 형성물이 단순한 복제가 아니라 사용된 저작물의 개작 또는 기타 변형물로 간주될 정도로 중대한 변화를 보이는지 여부를 추가로 검토해야 한다고 한다. 각각의 전체적인 인상이 달라지는 경우, 이는 복제나 개작이 아니라 자유로운 사용에 해당될 수 있다고 한다. 독립적인 저작물이 창작되고 원저작물이 새로운 저작물 창작의 기초가 된 경우 개정전 저작권법 제24조 제1에서 의미하는 자유로운 이용이 존재하는 것으로 간주된다고 한다.

생성형 인공지능의 경우 문제가 되는 것은 텍스트와 데이터 마이닝이 아니라 개별 사례에서 생성된 결과물이라는 점을 인정한다면, 연방대법원의 포르쉐 판결은 저작자에게 법적 수단이 충분히 제공되어 있다고 생각된다.

 

2) 저작권법 제44b조의 TDM

입법자의 의도는 유럽 연합에서 인공지능을 통한 작업을 방해하는 것이 아니라 이를 촉진하는 것이다. 따라서 저작권법 제44b조 제21문의 시행 이후에는 TDM을 위해 합법적으로 접근 가능한 저작물의 복제가 허용되어야 한다. 이 경우 제21문에 따른 사용은 권리보유자가 권리를 유보하지 않은 경우에만 허용된다(저작권법 제44b조 제31). 온라인으로 접근 가능한 저작물에 대한 이용 유보는 기계가 판독 가능한 형태로 이루어진 경우에만 유효하다(저작권법 제44b조 제31). 기계가 판독할 수 있는 형식이 구체적으로 무엇을 의미하는지는 논란의 여지가 있다. 하지만 한 가지 명확하고 간단한 옵션은 소위 ‘robot.txt’ 파일을 사용하는 것이다. 이 파일은 검색 엔진에서 읽을 수 있는 디렉터리를 지정할 수 있는 텍스트 파일이다. 이 파일을 기본 디렉토리에 저장하면 웹사이트 운영자는 웹크롤러에게 저작권법 제44b조 제31문에 따라 권리를 행사하고 있음을 알릴 수 있다.

해당 웹사이트의 법적 고지(또는 해당 웹사이트에 저장된 이용 약관)에 통지하는 방법도 고려할 수 있다. 하지만 저작권법 제44b조 제31문에 따른 정보는 기계가 읽을 수 있는 형식으로 제공해야 한다. 이는 저작자에게 처음부터 자신의 저작물을 보호할 수 있는 간단한 수단이 주어져 있다는 것을 의미한다. 해당 프로그래밍을 통해 웹크롤러의 접근을 쉽게 방지할 수 있다. 이 옵트 아웃 모델(Opt-Out-Modell)을 통해 저작자는 자신의 저작물이 생성형 AI에 제공되지 않도록 할 수 있다. 하지만 이 옵트 아웃 방식이 실제로 실효성이 있는지에 대해서 비판이 제기되고 있다. 왜냐하면 인공지능의 학습은 방대한 양의 불법 복제 저작물이 있는 사이트에서도 수행될 수 있기 때문이다. 불법 복제 사이트에는 음악과 영화 뿐 아니라 과학출판물도 존재한다. 따라서 이러한 사이트에서 자신의 저작물을 발견한 권리보유자는 옵트 아웃을 선언할 가능성이 거의 없다. 이전 점에서 옵트 아웃 방식은 그 목적을 달성하기 어렵다고 한다.

 

3) 저작권법 제60d조의 과학적 연구 목적의 TDM

저작권법 제60d조는 연구기관 및 문화유산기관이 확보한 데이터의 보관 가능성을 확대할 수 있다. 따라서 LAION과 같은 연구기관이 저작권법 제60d조를 주장할 수 있는지 문제가 될 수 있다. 독일연방의회는 응용 소프트웨어에 포함하기 위한 모델 또는 알고리즘의 프로토타입이 Spin-off(스핀오프)를 통해 완성되거나 상업적 개발자에게 판매되는 경우, 즉 시민 과학 접근 방식을 추구하는 경우에도 과학적 연구가 비상업적 목적과 연결될 수 있는지에 대해 의문을 제기하고 있다. 이것은 2015인류 전체에 가장 큰 혜택을 줄 수 있는 방식으로인공 지능을 개발하기 위해 비영리 단체로 설립된 Open AI가 그 예이다. Open AI는 이후 Microsoft파트너십’(2019년 말 10억 달러 투자)을 맺고 2020년부터 수익 상한 회사’(a capped-profit company)로 운영되고 있다고 성명을 통해 밝힌 바 있다.

 

(3) 소결

이 사안에서 스톡 사진 작가와 같은 저작자의 이해관계와 인공지능 개발자의 이해관계가 충돌하고 있다. 독립적인 저작물이 창작되고 이전 저작물이 새로운 저작물 창작의 기초가 된 경우, 저작권법 제23조 제1항 제2(개정전 저작권법 제24조 제1)에서 의미하는 자유 이용이 적용될 수 있다. 저작권법 제44b조는 웹크롤러가 자신의 저작물을 분석하지 못하도록 하는 방법을 규정하고 있다. 이것이 인공지능의 발전을 늦추거나 제한하는 것인지, 독일과 유럽연합에 경쟁상 불이익을 주는 것인지는 의문이다.

또한 저작권법 제60d조는 과학적 연구 목적으로 텍스트 및 데이터 마이닝을 위한 복제를 허용하고 있다. 그러나 과학적 연구 결과가 상업적으로 활용될 경우 어떻게 되는지에 대해서는 의문을 제기한다.

한편 사진작가는 자신의 소송을 통해서 인공지능학습에 사용되는 이미지에 대해 보상을 받아야 한다고 주장하고 있다. 현재 DSM 지침이나 독일 저작권법의 TDM에 대해서는 권리보유자에게 보상청구권을 인정하고 있지 않다. 생성형 AI와 이의 애플리케이션의 상업적 이용 가능성을 고려하면 기존의 복제보상금과 같이 TDM에 대해서도 보상청구권을 도입하는 것이 바람직해 보인다.

 

5. 맺음말

 

머신러닝은 인공지능(AI)의 기본적인 응용 분야이다. 머신러닝은 자신의 가능성을 지속적으로 개발하고 개선하기 위해서 방대한 훈련 데이터가 필요하다. OpenAIChatGPT와 같은 텍스트 생성기는 물론 Stability AI와 같은 이미지 생성기도 AI를 훈련시키기 위해 대량의 비교 데이터가 필요하다. 인공지능의 학습에 필요한 데이터는 주로 인터넷에서 웹크롤링이나 웹스크래핑과 같은 방법으로 수집한다. 인공지능은 이렇게 수집된 정보에 대해 학습을 마친 후 요청에 따라 다양한 형태(텍스트 또는 이미지 등)의 정보를 생성한다. 이와 같은 인공지능의 전체 학습과정에서 저작권 침해(주로 복제)가 발생할 수 있다. 그러나 이러한 복제는 저작권 제한 사유를 통해서 허용되는 경우에는 저작권 침해가 되지 않는다. EU와 독일 저작권법은 DSM 지침을 통해서 텍스트 및 데이터 마이닝이라는 저작권 제한사유를 도입하여 시행하고 있다. 이제 이와 관련한 법적 분쟁이 최초로 발생하였고, 현재 함부르크 지방법원이 이를 재판하고 있다. 그런데 이 사건은 비영리단체인 연구기관과 민간기업 사이의 민관파트너십이 문제되고 있다. 이러한 민관파트너십은 DSM 지침과 독일 저작권법에서 허용되고 있다. 따라서 함부르크 지방법원이 개별적인 사안에서 어떻게 판단할지 주목된다.

한편 지난 129EU 인공지능법안에 대한 삼자협상안이 잠정 타결되었다. 일부 공개된 협상안에는 대규모 생성형 AI 모델을 포함하는 범용 AI 모델 개념을 도입하였고 이 모델의 제공자에게 두가지 의무를 부여하고 있다. 하나는 인공지능이 학습한 콘텐츠에 대한 상세한 요약 정보의 제공 의무이고, 다른 하나는 TDM의 사용유보조항의 준수의무이다. 전자는 후자를 보완하기 위한 것으로 보인다.

EU 저작권 지침과 독일 저작권법에서 저작권 제한사유로서 도입된 TDM 조항에 대한 소개와 이후 판결 그리고 인공지능법에 범용 AI 모델 제공자의 저작권 관련 의무의 도입은 이러한 명문규정을 도입하지 않고 공정이용에 따라 법원의 판결을 통해서 해결해야 하는 미국과 우리나라에 참고 자료로 활용될 수 있을 것이다.

 

참고문헌

이 글에 인용된 모든 인터넷 자료는 2023.12.18. 확인함.

BeckOK UrhR/Hagemeier, 39. Ed. 1.8.2023, UrhG § 44b, § 60d.

Hahn, Was darf KI? Stockfotograf und KI-Verein streiten um das Copyright, Heise online, 2023.5.5 (https://www.heise.de/-8984836).

Kleinkopf, Felicitas/Jacke, Janina/Gärtner, Markus, Text- und Data-Mining, Urheberrechtliche Grenzen der Nachnutzung wissenschaftlicher Korpora bei computergestützten Verfahren und digitalen Ressourcen, MMR 2021, Heft 03, 196-200.

Kleinkopf, Felicita, Text- und Data-Mining, 2022, nomos.

Paal, Boris/Kumar, Lea Katharina, Die digitale Zukunft Europas, Europäische Strategien für den digitalen Binnenmarkt, ZfDR 2021, Heft 02, 97-129.

Pesch, Paulina Jo/Böhme, Rainer, Artpocalypse now? - Generative KI und die Vervielfältigung von Trainingsbildern, GRUR 2023, Heft 07, 997-107.

Raue, Benjamin, Die geplanten Text und Data Mining-Schranken (§§ 44b und 60d UrhG-E), ZUM 2020, Heft 03, 172-175..

Siglmüller, Jonas/ Gassner, Daniel, Softwareentwicklung durch Open-Source-trainierte KI Schutz und Haftung, RDi 2023, Heft 03, 124-132.

Söbbing, Thomas/Schwarz, Alexander, Urheberrechtliche Grenzen für lernende künstliche Intelligenz, Der neue § 44b UrhG und seine Möglichkeiten und Grenzen beim Machine Learning sowie die Anwendung von § 60d UrhG, RDi 2023, Heft 9, 415-419.

von Welser, Marcus, Generative KI und Urheberrechtsschranken, GRUR-Prax 2023, 516-520.

 

BGH, Urteil vom 8. 7. 2004 - I ZR 25/02 (OLG Hamm), GRUR 2004, 855-858.

BGH, Urteil vom 7.4.2022 I ZR 222/20 Porsche 911 (OLG Stuttgart), ZUM 2022, 547-558.

BT-Drucksache, 18/12329, S.41.

BT-Drucksache, 19/27426, S.88

Directive (EU) 2019/790.

 

Bericht des Ausschusses für Bildung, Forschung und Technikfolgenabschätzung (18. Ausschuss) gemäß § 56a der Geschäftsordnung, Drucksache 20/5149, 224 (Vorabfassung vom 9.1.2023).

DFG, Leitlinien zur Sicherung guter wissenschaftlicher Praxis, Kodex, 2019, Leitlinie 12, 13, 17.

Max-Planck-Gesellschaft, Regeln zur Sicherung guter wissenschaftlicher Praxis (https://www.mpg.de/229457/Regeln_guter_wiss_Praxis__Volltext-Dokument_.pdf).

삼자합의안(일부)

(https://www.openfuture.eu/wp-content/uploads/2023/12/231206GPAI_Compromise_proposalv4.pdf)

  • 담당자 : 손휘용
  • 담당부서 : 국제통상협력팀
  • 전화번호 : 0557920089

본 페이지의 내용이나 사용 편의성에 대해 만족하십니까?

  • 만족도 총 5점 중 5점
  • 만족도 총 5점 중 4점
  • 만족도 총 5점 중 3점
  • 만족도 총 5점 중 2점
  • 만족도 총 5점 중 1점
평가하기