| 제목 | [이슈리포트] 2025-11-[독일] 뮌헨지방법원: OpenAI ChatGPT의 복제권 및 전송권 침해 판결(박희영) | ||||||||
|---|---|---|---|---|---|---|---|---|---|
| 담당부서 | 통상산업연구팀 김영희(0557920092) | 등록일 | 2025-11-26 | ||||||
| 첨부문서 |
9. [이슈리포트] 2025-11-[독일] 뮌헨지방법원, OpenAI ChatGPT의 복제권 및 전송권 침해 판결(박희영).pdf
미리보기 |
||||||||
|
뮌헨지방법원: OpenAI ChatGPT의 복제권 및 전송권 침해 판결
독일 막스플랑크 국제형법연구소, 법학박사 박희영
독일 뮌헨 제1지방법원(이하 ‘법원’)은 2025년 11월 11일 독일 음악저작물 관리단체인 GEMA(Gesellschaft für musikalische Aufführungs- und mechanische Vervielfältigungsrechte)가 대규모 언어 모델(LLM) 개발 및 운영자인 OpenAI를 상대로 제기한 저작권 침해 소송에서 OpenAI의 ChatGPT 모델이 저작권을 침해했다고 판결했다. 이 사건은 OpenAI의 ChatGPT 서비스가 GEMA가 관리하는 9개 독일 노래 가사를 이용자의 질문(Prompt)에 대한 답변(Output)으로 그대로 또는 상당히 유사한 형태로 반복적으로 재현한 것이 문제되면서 시작되었다. 법원은 대규모 언어 모델(LLM) 내부에 저작물이 저장되는 현상, 즉 ‘기억 현상’(memorization)이 독일 저작권법 제16조에 따른 복제에 해당하여 침해를 구성한다고 판단했다. 특히, 법원은 이러한 모델 학습 과정의 영구적 저장 행위는 TDM(Text and Data Mining) 예외 규정으로 정당화될 수 없다고 명확히 선을 그었다. 나아가 ChatGPT가 저작물을 산출(Output)하여 이용자의 단말기에 표시하거나 서버 대화 기록을 저장하는 것 또한 독립된 복제권 침해이며, 불특정 다수에게 접근 가능성을 제공하는 것은 공중접근권(=전송권)(독일 저작권법 제19a조) 침해라고 보았다. 법원은 이 모든 침해 행위의 주체를 이용자가 아닌, 모델 운영 및 기술적 통제에 대한 행위지배를 가진 OpenAI로 보아 직접 행위자 책임을 물었다. 다만, 산출물(Output)이 자동적으로 생성되는 과정의 특성을 고려하여 저작자의 인격권 침해 주장은 받아들이지 않았다. 이 판결은 AI 모델 학습과 산출물에 대한 저작권법 적용의 기준을 제시했다는 점에서 유럽 AI 법제에 중대한 영향을 미칠 것은 물론 법적 논쟁도 치열해질 것으로 예상된다.
1) 사실관계 이 사건의 원고는 독일의 음악저작물 관리단체인 GEMA이고, 피고들은 대규모 언어 모델(LLM)인 ChatGPT 운영자인 OpenAI(미국 본사 및 유럽 지역 담당인 아일랜드 지사)이다. 아일랜드 지사는 유럽 지역에서 제공되는 ChatGPT 서비스와 해당 서비스의 기반이 되는 GPT-4 및 GPT-4o 언어모델을 운영·관리하고 있다. 이 언어모델은 방대한 크기의 학습데이터(공개 웹사이트 등에서 크롤링된 텍스트)를 기반으로 구축되었으며, 학습 과정에서 텍스트는 토큰(Token) 단위로 나뉘어 벡터화되며, 모델은 토큰(Token) 간 의미적 관계와 배열을 고차원 공간에서 파라미터(Parameter)로 형성한다. 이어지는 후속 학습 단계에서는 인간 평가자의 판단을 활용하여 모델은 산출물(Output)의 선호도를 조정하는 절차가 수행된다. ChatGPT는 대화형 생성 AI(Chatbot)로 이용자가 입력한 질문(Prompt)에 대해 텍스트 형태의 답변(Output)을 생성하여 산출한다. GEMA는 ChatGPT가 이러한 산출 과정에서 자사의 관리 대상인 9개 독일 노래의 가사를 그대로 또는 상당히 유사한 형태로 재현하는 사례가 반복적으로 발견되었다고 주장하였다. 이를 확인하기 위하여 GEMA는 여러 계정을 통해 ChatGPT 및 ‘커스텀 GPT’를 사용하면서, ‘가사 전문가(Experte für Liedtexte)’와 같은 역할을 부여하고, 온라인 검색 기능을 비활성화한 상태에서 특정 노래의 가사 제공을 요청하였다. 그 결과 ChatGPT는 해당 가사의 여러 구절을 원문과 거의 동일하거나 유사한 형태로 산출하였으며, 일부 경우에는 불완전하거나 왜곡된 형태의 텍스트도 산출된 것으로 나타났다. 2) 당사자의 주장 원고 GEMA는 피고가 운영하는 GPT-4 및 GPT-4o 모델이 자사가 관리하는 노래 가사를 권한 없이 복제(독일 저작권법 제16조 및 정보사회지침 제2조)하여 모델 내부에 기억시켰으며, 그 결과 ChatGPT가 가사를 동일하거나 식별 가능한 형태로 산출하므로, 이는 복제권 및 공중접근권(Recht der öffentlichen Zugänglichmachung)(저작권법 제19a조 및 정보사회지침 제3조)의 침해에 해당한다고 주장하였다. 원고는 또한 산출물 중 일부가 원작을 왜곡한 형태로 제시된다는 점을 들어, 저작인격권(독일 저작권법 제14조) 침해 가능성도 제기하였다. 아울러 피고의 모델 학습이 TDM(Text and Data Mining) 예외(독일 저작권법 제44b조 및 DSM 지침 제4조)의 범위에 포함되지 않으며, 자신은 이미 공지된 방식으로 TDM 이용을 금지하는 옵트아웃(Opt-out) 의사를 표시하였다고 주장하였다. 이에 근거하여 원고는 침해중지, 정보제공, 손해배상을 청구하였다. 이에 대해 피고는 GPT 모델은 학습데이터를 저장하지 않고 통계적 패턴으로 일반화할 뿐이므로 모델 내부에 저작물이 기억되어 있지 않다고 하여 복제권 침해를 부정하였다. 산출하더라도 이는 사용자의 개별 요청에 따른 생성 과정에 불과하며, 기술적으로 변형된 결과이므로 저작물의 식별 가능한 재현에도 해당하지 않는다고 주장하였다. 또한 ChatGPT의 산출물은 1:1 전달일 뿐 공중에게 제공되는 구조가 아니므로 저작권법 제19a조의 공중접근권 침해가 성립할 수 없다고 보았다. 나아가 피고는 모델 학습이 TDM 예외에 의해 정당화되며, 원고가 주장하는 옵트아웃(Opt-out) 고지는 법적으로 유효하거나 기술적으로 인식 가능한 방식이 아니었다고 지적하였다. 3) 법적 쟁점 이 사건의 핵심 쟁점은 첫째, GPT-4 및 GPT-4o가 학습 과정에서 생성하는 모델 파라미터가 저작권법상 복제에 해당하는지 여부이다. 즉 모델이 학습데이터를 통계적 일반화에 불과한 형태로 저장하는지, 아니면 저작물을 식별할 수 있는 부분이 고정(Fixierung)된 상태로 보존되는지에 대한 판단이 문제 되었다. 두 번째, 쟁점은 ChatGPT의 산출물이 화면 표시 및 서버 저장을 통해 복제권을 침해하는지, 그리고 다수의 이용자가 모델 파라미터에 저장되어 있는 저작물에 언제든지 접근할 수 있는 상태에 있다는 점을 고려할 때 공중접근권 침해가 성립하는지 여부였다. 특히 산출물이 원작과 동일하지 않고 변형된 경우에도 저작물의 식별 가능성이 유지될 때 침해가 인정될 수 있는지가 문제 되었다. 세 번째, 쟁점은 산출물 중 일부가 원작을 왜곡하는 경우 그러한 변형이 저작인격권 침해를 구성할 수 있는지 여부였다. 여기서 기술적 변형과 인격적 훼손 가능성의 구별이 법적 판단 요소가 되었다. 마지막으로 GPT 모델의 학습이 TDM 예외에 포함되는지, 그리고 원고가 표시한 옵트아웃(Opt-out) 고지가 예외 적용을 배제하는 방식으로 법적으로 유효한지 여부도 쟁점으로 제기되었다.
법원은 이 사안에서 피고의 ChatGPT가 노래 가사를 식별할 수 있게 반복하여 산출할 수 있는 점을 근거로 모델 내부에 저작물이 고정된다고 보아 복제권 침해를 인정하였고, 질문(Prompt) 화면 표시 및 서버 히스토리 저장은 독립된 복제로 보았으며, 모델 파라미터에 저장된 저작물에 불특정 다수가 접근할 수 있는 가능성을 제공하므로 공중접근권 침해도 인정하였다. 하지만 결과물은 기술적·자동적 생성 과정에 따른 것이고, 저작자에 대한 가치 판단이나 훼손 의도가 없으므로 저작자의 인격권 침해는 없다고 보았다. 1) 모델 내에서의 복제권 침해 법원은 이러한 모델의 학습을 통해서 모델이 원곡 가사의 본질적 표현을 식별 가능한 형태로 재현할 수 있으므로, 해당 표현이 모델 내부에 ‘포함되어 있다’고 보았으며, 이러한 재현 가능성이 곧 저작물의 표현이 모델 파라미터에 ‘기억’된 결과라고 평가하였다. 그리고 이와 같은 기억 상태는 저작권법상 복제에 해당한다고 판단하였다. 이러한 판단은 정보사회지침(2001/29/EC) 제2조(복제권) 및 제5조 제1항(일시적 복제 예외) 그리고 이를 이행한 독일 저작권법(UrhG) 제16조(복제권) 및 제44a조(일시적 복제 예외)에 근거하여 아래와 같이 구체적으로 논증하였다. (1) 대규모 언어 모델(LLM)의 생애주기별 단계 구분과 판결의 대상 법원은 GPT-4 및 GPT-4o가 학습 과정에서 수행하는 데이터 처리 과정이 저작권법의 ‘복제(Vervielfältigung)’에 해당하는지 여부를 검토하기 이전에 판단의 대상을 명확히 하기 위해서 다음 두 가지를 구분하였다. 즉 단순히 디지털 형식으로 변환하기 위한 목적이거나 분석 목적을 위한 복제와 모델 내부에 남아 있는 복제로 구분하였다. 그리하여 함부르크 지방법원의 LAION 판결에서 제시한 바와 같이 대규모 언어 모델의 생애주기를 시간적 순서대로 세 단계로 구분한다. 첫째, 학습 자료의 추출 및 기계가 읽을 수 있는 형식으로의 변환, 즉 ‘학습데이터세트의 생성 단계’, 둘째, 학습데이터세트 분석 및 메타정보 부가, 즉 ‘모델의 학습 단계’, 셋째, 그 이후 학습된 모델의 이용, 즉 ‘프롬프트 입력(prompt) 및 산출(output)을 통한 사용 단계’이다. 이 판결의 대상이 되는 것은 모델의 학습 단계와 학습된 모델의 사용 단계이다. (2) 복제권 침해의 근거로서 모델 내 ‘기억현상’(Memorisierung) 법원은 모델 내 복제권 침해의 근거로서 최근 IT 분야의 연구 결과인 ‘기억현상’(Memorisierung)를 원용하고 있다. ‘기억현상’이란 비특정 파라미터(unspezifische Parameter)가 학습 과정에서 특정(spezifiziert)되면서 학습데이터의 내용이 그대로, 또는 재현 가능한 형태로 파라미터 내부에 저장되어 산출되어 다시 추출될 수 있는 상태를 말한다. 이러한 기억현상은 학습과정에서 비특정 파라미터들이 단순히 학습데이터로부터 정보를 추출하는 것에 그치지 않고, 학습이 끝난 후 특정된 파라미터들 내부에서 학습데이터의 내용이 완전하게 이전되어 있는 경우에 존재한다고 한다. 특히 이와 같은 기억현상은 대규모 언어 모델(LLM)에서 자주 나타나는데, 그 원인은 특정한 학습데이터가 학습데이터세트에서 여러번 반복하여 등장하기 때문이다. 예컨대 동일한 텍스트가 인터넷의 여러 웹페이지에 중복되어 존재하므로, 중복 학습이 기억을 강화하는 요인으로 작용한다는 것이다. 학습데이터의 기억현상은 여러 방법을 통해 입증될 수 있다고 한다. 학습데이터가 알려진 경우에는, 단순한 프롬프트를 사용하여 충분한 텍스트 길이를 확보하고 훈련데이터와 산출물(Output)을 직접 대조함으로써 기억현상을 확인할 수 있다고 한다. 그렇지 않은 경우에는, 파라미터 엔트로피(entropy)나 퍼플렉시티(perplexity)와 같은 지표를 통해, 모델이 특정 산출물을 어느 정도의 확신을 가지고 재현하는지를 분석한다고 한다. 학습되거나 기억된 내용에 대해서는 그 확신도가 높게 나타난다고 한다. 법원은 소송대상인 노래 가사들이 피고의 해당 모델의 학습데이터로 사용되었다는 사실은 다툼이 없었고, 이 사안에서 기억 여부는 노래 가사와 산출물의 대조만으로도 확인될 수 있음을 인정하였다. 즉 매우 단순한 프롬프트를 사용했을 때, 해당 노래 가사들이 제시된 산출물에서 명확히 식별 가능한 형태로 재현된 것이다. (3) 모델 내 ‘기억’은 저작권법 ‘복제’에 해당 법원은 모델 내에서 소송대상인 노래 가사들이 기억되는 현상은 저작권법 제16조의 ‘복제’ (Vervielfältigung)에 해당한다고 판단했다. 법원은 GPT 모델이 학습 과정에서 저작물을 모델 파라미터(parameter), 가중치(weight), 벡터(vector) 등의 형태로 변환하여 저장한다는 점을 고려하면서, 이러한 저장이 전통적 의미의 텍스트 데이터 저장과 동일한 방식은 아니지만, 결국 저작물의 표현 요소가 “감각적으로 인식 가능한 형태로 재현 가능”하도록 고정된다는 점을 강조하였다. 이는 연방대법원(BGH) 판례가 지속적으로 강조해 온 기술중립성(Technologieneutralität) 원칙(저작물의 복제 여부는 저장 매체의 유형과 기술적 구조를 불문한다)에 의거한 것이다. 법원은 GPT 모델이 산출물 단계에서 원곡 가사를 표현하는 본질적 요소를 식별 가능한 형태로 재현할 수 있다는 사실을 근거로, 그러한 재현 가능성이 모델 내부에 해당 요소들이 고정되어 있다는 간접적 증거라고 보았다. (4) ‘복제’ 판단 기준 법원은 유럽사법재판소(CJEU, EuGH)가 정보사회지침의 복제에 관한 여러 판례(예를 들어 Infopaq, Painer, Football Dataco, Pelham 등)에서 확립한 법리를 적용하였다. 즉 ① 저작물의 표현 형식이 재현 가능해야 하고, ② 최소한의 독창성 요소가 그대로 남아 있어야 한다는 기준이다. 이 기준을 피고 모델의 파라미터에 적용한 결과, 모델은 단순한 통계적 패턴의 집합이 아니라, 저작물의 표현 형식이 재현 가능한 상태로 저장되어 있으며, 이러한 재현 가능성은 이미 여러 산출물 실험에서 구체적으로 확인되었다고 한다. 따라서 GPT 모델 내부의 파라미터에 남아 있는 정보는 정보사회지침 제2조의 복제 개념을 충족하는 ‘복제’에 해당한다. (5) 일시적 복제 예외 적용 배제 피고는 모델 학습을 “전송 과정 중 일시적 복제”에 해당한다고 주장하였지만, 법원은 다음의 사유로 배척하였다. 첫째, 정보사회지침 제5조 제1항은 일시적이고 부수적이며, 고유한 경제적 가치를 갖지 않아야 하는데, GPT 학습은 ‘부수적’이 아니라 모델의 핵심 목적이며, 결과물인 파라미터는 경제적 가치(모델 자체)를 형성하였다. 둘째, 일시적 복제는 삭제 가능하고, 프로세스가 종료되면 자동 소멸해야 하는데, GPT 모델 파라미터는 영구적으로 보존되며 후속 업데이트의 기초가 된다. 따라서 모델 학습 단계는 일시적 복제 예외의 범위를 벗어난 독립적인 복제 행위로 평가되었다. (6) TDM 예외 적용 가능성 이 사안에서 법원은 저작권법 제44b조(일반적 목적의 TDM 예외) 및 제60d조(연구 목적의 TDM 예외)를 적용할 수 없다고 하였다. GPT 모델 내부에서 발생한 기억 현상(즉 2단계에서의 모델 내부 복제)은 이러한 TDM 예외의 보호범위에 포함되지 않다는 것이다. TDM의 핵심은 “디지털화된 작품으로부터 정보만을 추출하여 패턴·트렌드·상관관계 등을 분석하는 것”이므로 TDM이 허용하는 것은 ‘작품 그 자체의 복제’가 아니라, 작품에 포함된 창작성 없는 정보의 분석이라는 것이다. 따라서 TDM 과정에서 허용되는 복제는 첫 번째 단계의 준비적·기술적 복제, 즉 텍스트를 기계가 읽을 수 있는 형식(Format)으로 정리하거나 메모리상에 일시적으로 저장하는 행위에 국한된다는 것이다. 이에 대해 GPT 모델에서 문제가 된 행위는 두 번째의 학습 단계에서 발생한 작품 자체의 재현 가능한 복제, 즉 특정 노래 가사를 모델 파라미터에 ‘재현할 수 있도록 포함 시키는’ 기억이었다. 법원은 이러한 행위가 단순한 정보 추출을 넘는 ‘작품의 전체적·실질적 고정’에 해당하며, 이는 TDM의 범위에 포함될 수 없고, 오히려 저작권자의 배타적인 경제적 이용권을 침해하는 복제 행위라고 판단하였다. 또한, DSM 지침 제4조와 저작권법 제44b조 제2항은 TDM 목적을 위한 목적적·필요한 복제만을 허용하는데, 두 번째 단계의 모델 내부에서 이루어지는 가사의 저장은 데이터 마이닝 목적을 충족하지 못한다고 지적하였다. 오히려 모델은 학습 데이터를 다시 생성하지 않도록 설계돼 있으며, 복제는 ‘부수적·비의도적’ 현상이라고 피고가 주장한 점을 고려하더라도, 그 자체가 TDM 목적의 복제가 아니라는 점이 TDM 적용 배제의 근거가 되었다. 나아가 법원은 ‘기술적 혁신의 촉진’이라는 DSM 지침의 목적만을 근거로 TDM 예외를 확장하는 유추해석을 허용하지 않았다. DSM 지침 제4조는 명확히 목적 제한적 조항이며, 모델에 영구적으로 잔존하는 복제는 입법자가 보호하려는 TDM 예외의 취지와 정면으로 충돌한다고 보았다. 또한, 현재의 EU 및 독일 법체계에서는 ‘AI 모델 학습을 위해 작품을 영구적으로 모델 내부에 저장하는 행위’를 정당화할 수 있는 일반적 TDM 예외가 존재하지 않을 뿐 아니라, 그러한 규범을 새롭게 마련해야 한다는 논의가 존재하더라도 아직 법적 근거로 채택될 수 없다는 점을 명확히 밝혔다. 마지막으로 OpenAI는 연구기관의 지위를 갖지 않기 때문에 저작권법 제60d조(연구 목적의 TDM) 역시 적용될 수 없다고 하였다. (7) 부수적 저작물 해당 여부 저작권법 제57조는 ‘본질적으로 목적물에 부수적이고 우연히 포함된 저작물’의 복제를 허용한다. 이 예외조항은 주된 저작물을 전제로 하는데, 피고들은 전체 학습데이터세트가 저작권법상의 저작물인지 주장하지 않았다. 또한, 피고들의 학습데이터세트의 편집 목적 - 즉, Common Crawl과 같은 주요 데이터 수집자가 저작권 보호 콘텐츠의 수집을 의도한 것이 아니라, 가능한 한 포괄적인 데이터세트를 특정한 목적 없이 수집했다는 주장 - 은 저작물성을 인정하기에 충분치 않다. (8) 권리자의 단순 동의 기본적으로 저작권법에 의해 보호되는 권리에 대한 위법한 침해라도 권리자의 단순 동의(schlichte Einwilligung)가 있는 경우에는 정당화될 수 있다. 이러한 동의의 존재여부는 의사표시의 객관적 내용을 표시의 수령자의 관점에서 판단해야 한다. 즉 권리자가 자신의 저작물을 아무런 제한 없이 일반 사용자에게 자유롭게 공개한 경우, 그 권리자가 통상적인 사용행위가 이루어질 것을 예견할 수 있었는지 여부이다. 그러나 본 사안에서는 문제된 노래 가사들이 자유롭게 접근이 가능한 상태였는지도 다투어지고 있다. 원고는 문제가 된 노래 가사들에 대하여 온라인 이용을 허용하는 라이선스를 부여한 적이 없으며, 그 밖의 다른 이용 영역에서도 모든 라이선스 계약에서 TDM 금지 조항을 일관되게 부과해 왔다. 무엇보다 모델의 학습은 권리자가 그 이용을 통상적이고 예견가능한 사용형태로 인식하거나 예상해야 할 행위로 평가될 수 없다. 이는 특히 본 사안과 같이 저작물이 모델 내에서 복제되는 경우에는 더욱 그러하다. 이러한 복제는 모델 운영자들조차 원치 않는 것으로 간주하며, 그에 대응하기 위한 기술적 방지 조치를 직접 취하고 있기 때문이다. 또한, 모델 학습은 권리자의 동일성 식별이 불가능한 복제물을 생성할 위험성을 내포한다. 마지막으로 만일 권리자의 단순동의가 있다고 가정한다면, 이는 제44b조의 제한규정을 무력화시키는 결과를 초래한다고 한다. 왜냐하면 해당 규정은 복제를 오직 TDM의 목적에 한해서만 허용하고, 그 범위를 그 이상의 복제행위로 확장하지 않기 때문이다. 따라서 모델 내에서의 기억은 정보사회지침 제2조 및 독일 저작권법 제16조의 복제권을 침해한다. 2) 산출물(Output)에서의 복제권 및 공중접근권 침해 법원은 산출물 단계에서 나타나는 ChatGPT의 텍스트 생성이 별도의 저작권 침해를 구성하는지 여부를 복제권(저작권법 제16조, 정보사회지침 제2조) 및 공중접근권(저작권법 제19a조, 정보사회지침 제3조)의 관점에서 평가하였다. (1) 독립적 창작 여부 우선 피고는 산출물(Output)의 경우 인간 창작과 달라서 이중창작의 기준을 적용할 수 없으므로, 저작권 침해가 성립하지 않는다고 주장하였다. 즉 독립적인 생성물로 취급되어야 하므로 침해가 아니라는 것이다. 하지만 이에 대해 법원은 이중창작 기준을 적용할 수 없을 뿐 아니라, 실제로도 독립적인 창작이 아니고, 모델이 기억한 가사를 그대로 재현한 것이므로 저작권 침해가 맞다고 판단했다. (2) 환각 현상(hallucination)과 저작물의 복제 및 변형 복제나 공중송신의 보호 범위가 개시되는지를 판단하는 핵심 기준은 소송대상 안에서 원저작물의 창작성 있는 요소가 인식 가능한지의 여부이다. 피고 모델의 산출물(Output)에서 소송 대상인 각 노래의 가사가 재현되는데, 이들은 적어도 하나 이상의 저작권으로 보호되는 요소이고 인식이 가능하다. 이는 AI 모델이 일부 내용을 변형하거나 혼합하여 생성하는 경우, 즉 ‘환각(할루시네이션)’이 존재하더라도 마찬가지라고 판단했다. 또한 산출물(Output)에서 재현된 저작물이 개작 또는 변형된 경우(저작권법 제23조)에도 그 결과가 유형물로 고정되는 경우에는 제16조의 복제에 해당한다. 따라서 저작권법 제16조(복제권)와 제23조(개작 및 변형)의 구별은 별도로 필요하지 않다. 유럽사법재판소 판례에 따르면 복제는 단순히 동일한 복제에 한정되지 않고 ‘전부 또는 일부’의 복제도 포함한다. 이는 또한 공중접근권에도 동일하게 적용된다. (3) 산출된 텍스트의 ‘복제’ 해당 여부 산출물(Output)은 이용자의 단말기 화면 및 대화 기록(채팅 히스토리)에 표시된다. 따라서 이는 최소한 이용자의 작업 메모리(RAM)와 피고들이 대화 기록 저장용으로 제공한 클라우드 서버에 복제된 것으로 보아야 하며, 이는 저작권법 제16조에서 복제행위에 해당한다고 판단했다. (4) 복제행위의 주체 BGH 판례에 따르면, 복제행위에 대해서는 형법상 정범·공범의 원칙이 적용되며, 공중전달권 침해가 아닌 한, EU 법상 공중전달과 관련한 책임 법리는 적용되지 않는다. 복제본의 제작자란, 그 복제행위, 즉 물리적 고정을 기술적으로 수행한 자를 말한다. 피고들은 행위자(Täter)로 평가된다고 한다. 왜냐하면 이들은 산출물(Output)을 통해 이루어진 복제 행위에 대한 행위지배(Tatherrschaft)를 행사하고 있기 때문이다. 피고들은 소송 대상인 노래 가사들을 학습데이터로 선정하여 학습시킨 모델을 직접 운영한다. 이들은 모델의 구조와 학습데이터의 기억에 대해 책임을 진다. 또한 피고들은 이용자의 산출물 행위와 관련하여 행위지배를 하고 있다고 한다. 즉, 이용자의 프롬프트 입력으로 산출물이 유도되더라도 그 결과물의 구체적 내용은 피고들이 운영하는 모델에 의해 생성되며, 모델이 산출물(Output)의 내용을 실질적으로 결정한다는 것이다. 따라서 단순히 이용자가 프롬프트를 입력하여 복제를 ‘유발’했다는 사실만으로 그를 복제의 주체로 볼 수는 없다고 한다. 피고들의 주장과 달리, 이 사건의 모델들은 단순히 사적 복제(Privatkopie)를 위한 장치를 제공하는 것에 불과하지 않다고 한다. 이는 과거의 인터넷 라디오 녹음기 사건과 다르다는 것이다. 이 사건에서 BGH는 이용자를 복제의 제작자로 평가한 바 있다. 또한 피고들의 모델은 단순한 녹음 장치가 아니며, 그들의 모델 설계와 산출물 내용의 형성에 대한 결정적 영향력을 고려할 때, 온라인 판매 플랫폼 운영자처럼 단순히 기술적 인프라만 제공하고 콘텐츠의 구체적 내용에 책임을 지지 않는 자와도 구별된다고 한다. 정보사회지침 제2조의 복제권이 완전히 조정된 점을 고려하여 유럽사법재판소의 판례에 따라 판단하더라도 결과는 마찬가지라고 한다. 유럽사법재판소는 지금까지 사적 복제 제한 규정의 적용 여부와 관련해서만 복제행위의 귀속 문제를 논의해 왔으며, 그 판단 기준으로 불특정 다수의 수신자에게 상업적 목적을 위해 보호된 저작물의 복제본에 접근할 수 있도록 허용했는지 여부를 제시하였다. 이와 유사한 상황에서 BGH는 역시 규범적·가치판단적 접근을 취하였다. 이러한 기준에 비추어 보더라도, 피고들은 복제의 제작자로 평가되어야 한다고 한다. 그들은 간단한 프롬프트 입력만으로 여러 이용자들이 문제된 노래 가사들에 접근할 수 있도록 허용함으로써, 대규모로 복제행위를 실현하고 있기 때문이다. (5) 산출물의 ‘공중접근권’ 침해 소송 대상인 노래 가사는 이용자가 모델에 접근하여 산출물을 생성할 수 있는 기능을 통해서, 즉 호출 가능성과 실제 산출물(Output)을 통해 피고들에 의해 공중에게 제공되고 있다. 공중접근권은 정보사회지침 제3조 제1항에 따라 완전히 조정되었다. 이 조항의 문언과 유럽사법재판소의 판례에 따르면, 공중접근은 ‘공중 전달(öffentliche Wiedergabe)’ 개념에 포함된다. ‘공중 전달’ 개념은 두 가지 요건이 동시에 충족되어야 한다. 즉 저작물의 전달행위가 존재하고, 그 전달이 공중을 대상으로 수행되어야 하며, 그 판단은 개별적·구체적 평가를 필요로 한다. 공중전달행위가 공중접근으로 평가되려면 추가적으로 한 가지 요건이 더 충족되어야 한다. 즉, 해당 공중이 그 보호대상(저작물)에 대하여 장소와 시간의 제약 없이, 스스로 선택한 때와 장소에서 접근할 수 있는 권한을 갖는 경우이다. 법원은 ChatGPT가 생성한 텍스트가 ‘공중이 접근할 수 있는 상태’에 있는지 여부를 정보사회지침 제3조의 목적에 따라 다음과 같이 분석하였다. ① 직접 전달행위 직접적인 공중전달행위가 성립하기 위해서는 저작물이 공중에게 제공되어 그 구성원들이 이에 접근할 수 있는 상태에 놓이는 것으로 충분하다. 이때 실제로 그들이 접근하여 실제 이용했는지는 문제가 되지 않는다. 공중전달행위의 존재를 위해서는 이미 작품의 접근 가능성만으로도 충분하다. 피고들은 모델과 챗봇의 운영자로서 그 안에 기억된 문제의 노래 가사들에 대해 접근을 개방하고 있으므로, 이는 그 자체로 공중전달행위를 구성한다. 소송대상인 노래 가사들은 피고들에 의해 산출물로 다시 재현되고 있다. 이러한 산출물로 인해 발생한 저작권 침해행위는 시스템적 원인에 기인하는 것이며, 산출물의 구체적 내용 구성은 모델의 운영자인 피고들에게 귀속된다. 피고들은 이 노래 가사들을 모델의 학습데이터로 사용하였고, 학습데이터세트를 직접 구축·가공하고 학습 과정을 수행하였다. 그 결과 학습데이터가 모델 내부에 기억되었다. 또한 피고들은 모델의 아키텍처(구조 설계)에도 책임이 있다. 산출물에 이르게 한 프롬프트들은 매우 단순하게 구성되어 있었고, 이용자에게 특정한 내용을 지시하지 않았다. 따라서 피고들의 주장과 달리, 이처럼 내용을 구체적으로 지시하지 않는 단순한 프롬프트의 경우 그로부터 발생한 산출물의 저작권 침해를 ‘이용자’에게 귀속시킬 수 없다. 피고들은 공중전달행위를 직접 수행한다. 즉, 피고들은 스스로 공중에게 작품의 이용을 개방하고 있으며, 단순히 제3자의 이용행위를 위해 인프라만 제공하는 중개자로서 행동하는 것이 아니다. 피고들은 자신들의 모델 내용에 대한 책임을 지며, 이 내용들이 간단한 프롬프트를 통해 그대로 산출물될 수 있는 구조를 갖추고 있으므로, 그들의 활동은 호스팅 플랫폼 운영자나 하드웨어·소프트웨어 제공자와 동일하게 볼 수 없다. ② 간접 전달행위 이와 달리 단순히 간접적으로 관여하는 자의 경우에는, 유럽사법재판소 판례에 따르면 공중전달행위로 인정되기 위해 추가적인 요건이 요구된다. 유럽사법재판소는 이러한 사안에서 여러 상호의존적인 판단 기준들을 종합적으로 고려한다. 특히 제공자의 중심적 역할(Zentralrolle des Anbieters)과 고의성(Vorsätzlichkeit)이 중요한 기준으로 작용한다. BGH는 유럽사법재판소가 제시한 요건들을 거래안전의무 (Verkehrspflichten)로 이행하였다. 따라서 이러한 요건을 위반하게 되면 거래안전의무를 위반하는 ‘행위자’(침해자)가 된다. 이러한 거래안전의무는 책임의 범위를 확장하는 기능을 가지며, 이는 원래의 직접 침해자 외에 간접 침해자까지 포함시키게 된다. 그러나 법원은 본 사안과 같이 직접 이용행위가 존재하는 경우에는 이미 침해행위가 추정되므로 별도의 추가 요건 검토는 필요하지 않다고 한다. 피고들은 간접침해에 적용되는 책임 확장 기준을 자신들의 직접침해에 대한 책임에서 벗어나는 근거로 이용하려고 한다. 피고들은 범용 모델을 제공하는 행위의 특성상, 검색엔진이나 플랫폼 운영자에 관한 판례에서 발전된 것과 유사한 가치판단적 조정이 책임 판단에서도 필요하다고 주장한다. 그러나 법원은 직접 침해의 경우에는 그러한 가치판단적 조정이 요구되지 않는다고 판단했다. 전달행위의 개념은 사용된 기술적 수단이나 절차와 무관하게 보호된 저작물의 모든 형태의 전송을 포함하며, 그 범위에는 AI 모델 또한 포함된다고 한다. 설령 추가적으로 다른 판단 기준들을 검토하더라도, 여전히 피고들의 행위는 전달행위에 해당한다고 한다. 법원은 다음과 같이 그 이유를 제시하였다. 첫째, 피고들은 저작물의 재현에 있어 중심적 역할을 수행한다. 둘째, 문제된 노래 가사들이 간단한 프롬프트만으로 산출물 가능한 것은 이들이 모델에 해당 가사들을 기억시켰기 때문이다. 셋째, 피고들이 모델의 작동 방식, 학습 데이터의 선정, 학습 설계 및 구조를 직접 결정한다. 넷째, 산출물 프롬프트는 내용상 단순하고 조작이 매우 용이하며, 복잡한 폴더 구조나 제어 메뉴 없이 단순히 명령어만 입력하면 된다. 또한, 피고들은 자신들의 행위 결과를 충분히 인식하고 있다고 한다. 법원에 따르면 최소한 2021년 이후부터 모델 내부에서 학습데이터가 기억된다는 사실을 이미 알고 있었다는 것이다. 마지막으로, 피고들이 수행한 이러한 공중전달행위는 영리 목적을 지닌다. 비록 영리 목적이 공중전달행위를 충족시키는 필수적인 요소는 아니지만, 그 요소는 판단상 무시할 수 없는 요소라고 한다. ③ 전달의 공중성 해당 전달행위는 공중을 대상으로 수행된다. ‘공중성(Öffentlichkeit)’ 개념은 양적 측면과 질적 측면이라는 두 요소를 포함한다. 우선 양적인 측면의 ‘공중’이라는 개념은 불특정 다수의 잠재적 수신자를 포괄하며, 일정한 수 이상의 사람들을 전제로 한다. 본 사안에서는 이러한 요건이 충족된다고 한다. 피고들의 모델에 접근 가능한 챗봇은 기본적으로 인터넷 접속과 인터넷 이용이 가능한 단말기를 가진 모든 사람이 이용할 수 있다. 무료 등록도 가능하며, 제한된 접근을 위해 회원가입이 필수적이지 않다. 따라서 모델에 기억되어 문제가 된 노래 가사들에 대해 충분히 많은 수의 사람들이 접근할 수 있는 상태가 형성되어 있다. 둘째 질적인 측면에서는 다음의 요건이 충족되어야 한다. 보호받는 저작물이 ① 이전에 사용된 것과는 다른 특정한 기술적 절차를 통하여 또는 ② 새로운 공중(neues Publikum) - 즉, 권리자가 최초로 공중전달을 허락할 당시 예상하지 않았던 이용자 집단을 대상으로 재현되는 경우여야 한다. 원고는 이미 피고들이 주장하는 바와 같이 문제가 된 노래 가사들이 권리자의 동의를 얻어 인터넷상에서 이용 가능하였다는 점을 부인하였다. 그러나 설령 웹사이트상의 공개가 적법했다고 가정하더라도, 만약 해당 콘텐츠가 권리자의 동의 없이 다른 웹사이트에 게시된다면, 이는 새로운 공중을 대상으로 한 이용으로 보아야 한다. 하물며 본 사안과 같이, 그 이용이 단순히 다른 웹사이트가 아니라 AI 모델을 통해 이루어지는 경우에는 더욱 그러하다고 한다. 문제가 된 노래 가사들은 피고들의 챗봇 이용자들이 원하는 장소와 원하는 시간에 접근할 수 있는 형태로 제공된다. 피고들의 챗봇은 인터넷 접속이 가능한 단말기만 있으면 누구나, 어디서든, 언제든 이용할 수 있으므로 이 요건을 명백히 충족한다. (6) 제한사유 ChatGPT의 산출물(Output)을 통한 저작재산권의 경제적 이용권 침해는 제한 사유에 의해서도 정당화되지 않는다고 한다. 우선 산출물에 의한 복제권 및 공중접근권 행사는 일반적 또는 학술연구 목적의 TDM 제한사유에 포함되지 않는다. 산출물(Output)은 저작권법 제51조의 인용으로도 정당화되지 않는다. 나아가서 산출물(Output)은 패스티시(pastiche)로서 저작권법 제51a조의 제한규정에 의해서도 정당화되지 않는다. 이 조항은 정보사회지침 제5조 제3항 (k)를 이행한 것으로서, 이와 마찬가지로 패스티시를 목적으로 한 이용을 요구한다. 따라서 기존의 저작물 또는 다른 참조대상과의 예술적 대화 또는 창작적 변형이 필요하다. 그러나 모델은 예술적 인격(Personlichkeit)이 결여되어 있으며, 보호 가능한 표현요소를 통해 자신의 인격을 예술적으로 표현할 수 없으므로 이러한 예술적 대화를 수행할 수 없다. 또한, 산출물로 이어진 단순한 형태의 프롬프트 역시 어떠한 예술적 내용도 담고 있지 않다. 게다가 문제가 된 산출물(Output)에 의한 복제 행위는 저작권법 제53조 제1항의 사적 복제에 의해서도 정당화되지 않는다. 문제가 된 산출물로 인한 복제 행위는 피고들에게 귀속되어 그들의 책임을 구성한다. 하지만 피고들은 법인으로서 정보사회지침 제5조 제2항 (b)에 근거한 개인적 사용을 위한 복제 예외를 주장할 수 없다. 저작권법 제53조에 따른 복제권의 제한은 비영리 목적의 사적 이용을 위해 복제를 행하는 자연인에게만 적용되기 때문이다. 마지막으로 모델 내의 복제 행위와 마찬가지로, 모델의 산출물 단계에서 이루어진 이용행위에 대해서도 권리자의 위법성을 정당화하는 동의는 존재하지 않는다. 단순한 프롬프트의 입력 결과로서 산출된 산출물 형태의 복제 행위는 권리자가 예상할 수 있는 통상적인 이용행위에 해당하지 않기 때문이다. 따라서 모델의 산출물(Output)은 복제권(독일 저작권법 제16조, 정보사회지침 제2조)과 공중접근권(독일 저작권법 제19a조, 정보사회지침 제3조)을 동시에 침해한다. 3) 인격권 침해 배제 마지막으로 법원은 원고가 주장한 일반적 인격권 침해를 인정하지 않았다. 제출된 일부 산출물(Output)에 대해서는 애초에 노래의 작사가가 잘못 표시된 경우가 없었으며, 변형된 가사도 실제 작사가가 아니라 해당 곡의 가수·밴드명으로 귀속되어 있었기 때문이다. 나머지 산출물(Output)에 대해서도, 일반적 인격권 침해가 성립하기 위해 요구되는 ‘타인의 창작물을 저작자로서 잘못 귀속받아 정체성 혼동을 초래하는 상황’이 존재하지 않는다고 보았다. 법원은 이러한 상황이 존재하는 경우 일반적 인격권이 적용될 여지가 있으나, 본 사안의 산출물(Output)은 단순한 ‘저작물의 변형·편곡’에 해당하며 자유 이용도 아니기 때문에, 이러한 오인 가능성은 발생하지 않는다고 판단하였다. 나아가 법원은 본 사안이 일반적 인격권 보호가 개시되는 영역인지도 부정하였다. 작사가의 이름이 변형된 가사나 편곡물에 표시되는 문제는 그들이 사회에서 활동하는 직업적 영역, 즉 사회적 영역에 속하는 사안일 뿐 개인의 내밀한 사생활이나 인간적 존엄이 문제되는 영역이 아니다. 사회적 영역에 대한 인격권 보호는 제한적으로만 인정되며, 명예 훼손·낙인 효과·사회적 배제와 같은 중대한 침해가 존재할 때에만 문제가 될 수 있다. 법원은 본 사건의 산출물(Output)이 이러한 정도의 심각한 인격적 침해를 발생시키지 않는다고 판단했으며, 따라서 일반적 인격권 침해에 기초한 청구는 인정될 수 없다고 판단했다.
뮌헨 제1지방법원의 이번 판결은 생성형 인공지능의 핵심 작동 방식인 ‘모델 내부의 저작물 기억현상’에 대해 저작권 침해라는 명확한 판단을 내린 선도적인 사례로 평가된다. 이는 AI 산업 전반, 특히 학습 데이터의 취득 및 관리, 그리고 새로운 라이선스 모델 구축에 중대한 영향을 미칠 것으로 보인다. 1) 법적 해석의 중대성 - 복제의 범위와 TDM 예외의 한계 법원은 피고의 모델이 이용자의 단순한 프롬프트(Prompt)에도 불구하고 저작물의 가사 전체 또는 상당 부분을 반복하여 정확하게 재현할 수 있다는 점에 주목했다. 이는 해당 저작물이 모델 파라미터 내부에 일종의 영구적인 기억형태로 유형적으로 고정되어 있음을 증명하며, 이를 독일 저작권법 제16조가 규정하는 복제로 인정했다. 특히, 법원은 이용자가 가사를 요청하는 행위를 일반적인 AI 대화가 아닌, 저작물이 저장된 모델이라는 데이터베이스에 대한 단순한 질의로 해석했다. 이는 OpenAI가 이용자의 프롬프트를 ‘새로운 창작’의 계기로 해석하여 책임에서 벗어나려던 주장을 정면으로 반박한 것이다. 저작물이 모델 내부에 이미 존재하기에 단순한 질문에도 산출물될 수 있으며, 이는 AI 운영자가 의도하고 설계한 복제 행위의 결과로 보아 침해 행위의 직접적인 행위자로 판단했다. 법원은 AI 학습 과정에서 발생하는 내부 복제를 TDM 예외로 정당화할 수 없다고 판단했다. TDM 예외는 원칙적으로 ‘저작물에 포함된 정보를 분석하고 추출하는 것’을 목적으로 한다. 그러나 본 사건에서 발생한 기억현상은 분석을 넘어 저작물 자체가 재현 가능한 형태로 모델 내부에 잔존하는 ‘영구적인 저장’을 의미하며, 이는 저작권자의 배타적 권리를 침해할 정도로 그 효과가 크다고 보았다. 이는 AI 모델 학습을 위한 데이터 이용을 광범위하게 허용했던 기존의 TDM 예외 규정을 저작권자의 이익 보호 관점에서 매우 엄격하게 해석한 것으로, AI 개발사들에게 TDM 예외가 ‘모델 훈련을 위한 모든 복제 행위’를 정당화하는 만능 키가 아님을 시사한다. 2) 책임 주체의 명확화와 산업 전반의 영향 법원은 산출물(Output) 생성 과정에서 이용자는 ‘단순히 메커니즘을 유발했을 뿐’이며, 산출물의 내용과 기술적 구조를 실질적으로 결정하고 모델 운영에 대한 행위지배를 행사하는 OpenAI가 직접적인 복제 및 공중접근 행위의 주체(Täter)라고 결론지었다. 이로써 AI 운영자의 법적 책임을 명확히 하고, 최종 이용자에게 책임을 전가하려는 시도를 차단했다. 이는 AI 서비스 모델에서 법적 리스크를 운영 주체가 전적으로 부담하게 만드는 중요한 분기점이 될 것으로 보인다. 한편 이 판결은 단순히 음악 저작권 분야에 국한되지 않고, AI 시스템을 이용하는 저널리즘, 문학, 사진 등 모든 창작 영역에 시그널 효과를 준다. 독일기자협회(DJV)는 이 판결을 환영하며 “AI 모델 학습은 지적 재산의 절도”라는 입장을 밝히는 등, 저작권자의 권익을 대변하는 단체들이 이 판결을 중요한 이정표로 삼을 전망이다. 3) 상급심의 역할과 유럽사법재판소에 선결 재판 제청 가능성 이 판결은 저작물의 ‘저장 여부’에 대해 유럽 차원의 판단과 차이가 있음을 보여주기도 한다. 뮌헨 제1지방법원이 ChatGPT 모델 내부에 가사가 ‘포함되어 있다’고 추정한 것과 달리, 불과 몇 주 전 영국 고등법원은 Getty Images 대 Stability AI 사건에서 Stability AI가 저작권 보호 저작물을 저장하지 않았다고 판단하여 Getty Images가 대부분 패소한 사례가 있었다. 이러한 차이는 기술의 유형(대규모 언어 모델 vs. 이미지 생성 모델) 또는 법원이 채택한 증거 및 기술 평가 방식의 차이에서 비롯된 것으로 보인다. 따라서 피고인 OpenAI는 항소할 가능성이 매우 높다. 이 사건은 유럽 AI 관련 저작권 분야의 근본적인 쟁점을 다루고 있으므로, 독일 연방대법원을 넘어 유럽사법재판소의 판단을 구하게 될 가능성도 크다. 상급심에서는 특히 TDM 예외 규정의 유럽연합 차원의 해석, 그리고 대규모 언어 모델(LLM) 내부의 기술적 복제 행위를 어떻게 평가할 것인지에 대한 최종적인 기준이 제시될 것으로 예상된다. 4) 미래 전망과 AI 기업의 대응 과제 이 판결로 인해 AI 개발사들은 저작권 콘텐츠를 포함한 학습 데이터에 대해 새로운 라이선스 모델을 구축하고 적정한 보상을 제공해야 한다는 압박에 직면하게 되었다. 단순히 TDM 예외에 의존하기보다, 저작권자와 직접 협상하여 모델 학습을 위한 ‘복제 라이선스’를 확보하는 것이 필수가 될 것이다. 또한, 법원은 침해 위험을 최소화하기 위한 AI 운영자의 기술적 조치 의무를 강조했다. 우선 학습데이터에서 저작권 보호 콘텐츠, 특히 가사나 전문 텍스트가 모델 내부에 재현 가능한 형태로 고정되지 않도록 하는 강력한 필터링 기술을 적용해야 한다. 또한 판결 내용에 따라 침해로 인정된 노래 가사를 더 이상 산출하지 않도록 모델을 재훈련하거나 구조적으로 조정해야 한다. 결론적으로, 뮌헨 제1지방법원 판결은 AI의 혁신과 저작권 보호 사이에서 균형을 모색하는 사법적 노력의 일환이며, AI 개발 및 운영 기업들에게 법률 준수 및 책임성에 대한 요구 기준을 한층 높이는 계기가 될 것으로 보인다.
LG München I, Endurteil v. 11.11.2025 – 42 O 14139/24 (https://www.gesetze-bayern.de/Content/Document/Y-300-Z-GRURRS-B-2025-N-30204?hl=true) beck-aktuell, ChatGPT klaut Grönemeyer: GEMA siegt gegen OpenAI, 11.November 2025 (https://rsw.beck.de/aktuell/daily/meldung/detail/lg-muenchen-i-42o1413924-streit-liedtexte LG München I: . In: Legal Tribune Online, 11.11.2025 (https://www.lto.de/persistent/a_id/58587)(방문: 2025.11.14.). 박형옥, 영국 England and Wales 법원(1심): Getty Images의 2차적 침해 주장 기각, Stability AI의 2차적 저작권침해 부정 판결, 유럽법제동향, 로앤비, 2025.11. 박희영, 생성형 인공지능 모델 학습과 TDM 제한 – 함부르크 지방법원 판결(Kneschke vs. LAION)-, 이슈리포트 2024-28, 저작권 위원회.
|
|||||||||
| 이전글 | [이슈리포트] 2025-10-[독일] 콘텐츠 전송 네트워크(CDN) 운영자의 저작권 책임(박희영) |
|---|---|
| 다음글 | 다음글이 없습니다. |