| 제목 | [이슈리포트] 2025-제18-[독일] 함부르크 고등법원, TDM은 AI 모델 학습용 데이터셋 작성에도 적용된다고 판결(박희영) | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 담당부서 | 통상산업연구팀 김영희(0557920092) | 등록일 | 2025-12-23 | |||||||
| 첨부문서 |
[이슈리포트] 2025-18-[독일] 함부르크 고등법원, TDM은 AI 모델 학습용 데이터셋 작성에도 적용된다고 판결(박희영).pdf
미리보기 |
|||||||||
|
함부르크 고등법원, TDM은 AI 모델 학습용 데이터셋 작성에도 적용된다고 판결
(OLG Hamburg, Urteil vom 10.12.2025 – 5 U 104/24(Kneschke vs. LAION)
독일 막스플랑크 국제형법연구소, 법학박사 박희영
이 사건은 사진작가가 자신의 사진이 AI 학습용 데이터셋 제작 과정에서 무단으로 다운로드 및 복제되었다고 주장하며 제기한 소송에 대한 함부르크 고등법원의 항소심 판결이다. 이번 판결의 핵심 쟁점은 AI 모델 학습을 위해 데이터를 수집·분석하는 행위가 저작권법상 ‘텍스트 및 데이터 마이닝(TDM)’ 면책 규정(독일 저작권법 제44b조 및 제60d조)의 적용을 받는지, 그리고 자연어(Natural Language)로 된 이용 약관이 법적으로 유효한 ‘기계가 판독 가능한 이용 유보(Opt-out)’에 해당하는지 여부이다. 1심 법원은 피고의 행위를 ‘과학적 연구 목적의 TDM(제60d조)’으로 인정하여 면책하면서도 일반 TDM(제44b조)의 적용 여부에 대해서는 판단을 유보했던 것과 달리, 함부르크 고등법원은 제44b조를 정면으로 적용하였다. 항소심은 2021년 기술 수준에서 자연어로 된 이용 약관은 자동화된 봇(bot)이 해석하여 실행할 수 없으므로 유효한 이용 유보가 아니라고 판시하며, 피고의 데이터셋 제작 행위가 적법하다고 결론지었다. 이번 판결은 AI 학습 데이터 확보를 위한 TDM 면책의 범위를 명확히 하고, 이용 유보의 요건으로 ‘기계적 실행 가능성(machine-actionable)’을 요구함으로써 향후 AI 저작권 관련 기술 표준 정립의 필요성을 시사했다는 점에서 큰 의의가 있다.
1) 사실관계 원고(Robert Kneschke)는 사진작가이며, 피고는 이미지와 텍스트 설명이 쌍(pair)을 이루는 데이터셋을 구축하여 공중에게 무료로 공개하는 등록된 협회이다(LAION e.V.). 피고가 제공하는 이 데이터셋은 약 58억 5천만 개의 이미지와 텍스트의 쌍을 포함하고 있으며, 주로 생성형 인공지능(AI)을 학습(Training)하기 위한 목적으로 활용된다. 피고는 자체 데이터셋을 구축하기 위해 미국 소재 기관이 생성한 기존의 데이터셋(인터넷상 이미지의 URL과 텍스트 설명이 포함된 무작위 데이터)을 기초 자료로 활용했다. 피고는 이 기초 데이터셋에서 이미지 URL을 추출한 뒤, 2021년 하반기에 해당 URL에 연결된 이미지 파일들을 자신의 저장 공간으로 다운로드했다. 피고는 다운로드 후, 소프트웨어를 사용하여 각 이미지의 시각적 내용이 기존에 메타데이터로 존재하던 텍스트 설명(Alt-text)과 실제로 일치하는지를 분석했다. 분석 결과, 이미지와 텍스트 설명이 충분히 일치하지 않는 데이터는 걸러내고(filtering), 검증된 이미지들의 URL과 메타데이터(이미지 설명 등)만을 추출하여 피고의 새로운 데이터셋에 수록했다. 최종적으로 공개된 피고의 데이터셋에는 이미지 파일 자체가 아니라 검증된 하이퍼링크와 메타데이터만 포함되었다. 이러한 데이터 분석 및 필터링 과정에서, 원고가 저작권을 가진 사진 한 장이 피고에 의해 다운로드되어 분석되었다. 해당 사진은 스톡 사진 에이전시 웹사이트에 게시되어 있었으며, 피고가 다운로드한 파일은 에이전시의 워터마크가 삽입된 미리보기(썸네일) 형태의 파일이었다. 원고의 사진이 게시되어 있던 에이전시 웹사이트의 하위 페이지에는 2021년 1월 13일경부터 “제한사항(RESTRICTIONS)”이라는 이용 약관이 명시되어 있었다. 해당 약관 제18조는 “콘텐츠 다운로드, 인덱싱, 스크래핑 또는 캐싱 등을 포함하여 어떠한 목적으로든 웹사이트나 콘텐츠에 접근하기 위해 자동화된 프로그램, 애플릿, 봇(bot) 등을 사용하는 행위”를 금지한다고 자연어(영어)로 규정하고 있었다. 2) 법적 쟁점 및 당사자의 주장 (1) 텍스트 및 데이터 마이닝(TDM) 해당 여부(저작권법 제44b조 및 제60d조 관련) 원고는 피고가 기존 데이터셋의 이미지와 텍스트 설명이 일치하는지 확인하기 위해 이미지를 복제한 행위는 새로운 지식을 얻는 과정이 아니므로 법률이 정한 TDM에 해당하지 않는다고 주장했다. 원고는 피고의 행위가 단지 AI 학습을 위한 데이터를 준비하거나 가공하는 과정일 뿐이며, 이는 데이터에 숨겨진 정보를 분석하는 진정한 의미의 마이닝이 아니라 저작물의 콘텐츠 자체를 경쟁적으로 이용하려는 시도라고 보았다. 이에 대해 피고는 이미지 파일과 그에 대한 텍스트 설명(메타데이터)이 서로 일치하는지를 검증하는 과정은 데이터 간의 ‘상관관계’(Korrelation)를 파악하기 위한 분석이므로 TDM의 정의에 부합한다고 주장했다. 또한 피고는 이러한 데이터 가공 작업이 생성형 AI 모델의 성능을 검증하고 향상하기 위한 필수적인 연구 과정이며, 이는 입법자가 TDM 조항을 통해 장려하고자 했던 혁신적인 기술 개발 활동에 해당한다고 반박했다. (2) 기계 판독 가능한 이용 유보(Opt-out)의 효력(저작권법 제44b조 제3항 관련) 원고는 사진이 게시된 웹사이트 약관에 자연어(영어)로 “자동화된 프로그램에 의한 스크래핑 금지”를 명시했으므로, 이것이 유효한 이용 유보(Opt-out)에 해당한다고 주장했다. 원고는 기술적으로 기계가 인간이 읽을 수 있는 텍스트를 인식할 수 있으므로, 자연어로 된 약관도 ‘기계가 판독 가능한’ 수단으로 인정받아야 하며 이에 대한 별도의 기술적 표준이 강제되어서는 안 된다고 강조했다. 그러나 피고는 웹사이트의 일반적인 이용 약관에 포함된 자연어 문구는 자동화된 크롤러 봇이 명확하게 인식하고 해석할 수 없으므로, 법이 요구하는 ‘기계가 판독 가능한 형태’의 이용 유보가 아니라고 주장했다. 피고는 특히 사건 당시인 2021년의 기술 수준을 고려할 때, 자연어 약관은 해석의 오류 가능성이 커서 자동화된 대량 데이터 처리에 부적합하며, 구조화된 데이터 (예: robots.txt 등)만이 유효한 수단이 되어야 한다고 반박했다. (3) 과학적 연구기관의 지위 및 비상업적 목적(저작권법 제60d조 관련) 원고는 피고가 표면적으로는 비영리 단체이지만, 실제로는 Stability AI와 같은 상업적 AI 기업으로부터 자금 지원을 받거나 인적 교류를 통해 사실상 지배를 받고 있으므로 ‘비상업적 연구 기관’으로 볼 수 없다고 주장했다. 원고는 피고가 만든 데이터셋이 결과적으로 상업적 기업들의 AI 학습에 무료로 제공되어 그들의 이익을 위해 기여하므로, 이는 과학적 연구를 핑계로 저작권법의 예외를 악용하는 것이라고 비판했다. 이에 대해 피고는 자신이 정관상 연구와 교육을 목적으로 설립된 등록 협회이며, 데이터셋 구축 및 공개를 통해 AI 연구의 민주화와 투명성에 기여하고 있으므로 명백한 과학적 연구기관이라고 주장했다. 피고는 상업적 기업과의 협력이나 기부금 수령은 연구 수행을 위한 통상적인 활동일 뿐 기업의 지배적 영향력을 의미하지 않으며, 결과물을 공중에게 무료로 공개하는 오픈 소스 방식이므로 비상업적 목적이 유지된다고 강조했다. (4) 3단계 테스트 및 저작권자의 이익 침해 여부 원고는 피고의 대규모 데이터 복제 행위가 결과적으로 원고의 사진을 대체할 수 있는 생성형 AI의 개발로 이어져, 저작물의 통상적인 이용(라이선스 시장 등)을 방해하고 저작권자의 정당한 이익을 심각하게 해친다고 주장했다. 이에 대해 피고는 자신들이 제작한 데이터셋에는 저작물 원본이 아니라 원본으로 연결되는 하이퍼링크만이 포함되어 있으므로, 데이터셋 자체의 배포가 원고의 사진 판매 시장과 직접 경쟁하지 않는다고 반박했다. 피고는 AI 학습을 위한 내부적이고 일시적인 복제는 저작권자의 통상적인 이용을 저해하지 않으며, 기술 혁신을 위한 사회적 이익이 더 크다고 보았다.
1) 과학적 연구를 위한 TDM 면책 인정(제60d조 관련) 1심 법원은 피고의 데이터셋 구축 행위가 저작권법 제60d조(과학적 연구를 위한 텍스트 및 데이터 마이닝)에 의해 정당화된다고 판단하여 원고의 청구를 기각했다. 법원은 피고가 이미지와 텍스트 설명의 일치 여부를 검증하여 데이터셋을 제작한 과정이 미래의 지식 습득을 목표로 하는 기초적인 단계로서 ‘과학적 연구’ 목적에 부합한다고 보았다. 또한, 피고 협회는 연구를 목적으로 하는 비상업적 단체이며, 상업적 AI 기업(Stability AI 등)과의 협력 관계가 존재하더라도 해당 기업이 피고에게 지배적인 영향력을 행사하거나 연구 결과에 우선적으로 접근했다는 사실이 입증되지 않았으므로 제60d조의 적용이 배제되지 않는다고 판시했다. 2) 일반 TDM 면책 및 이용 유보의 효력에 대한 판단 유보(제44b조 관련) 1심 법원은 제60d조에 의해 피고의 행위가 이미 적법하다고 판단했으므로, 일반적인 TDM 면책 규정인 제44b조의 적용 여부에 대해서는 최종적인 판단을 명시적으로 유보했다. 다만, 법원은 방론(Obiter Dictum)을 통해 원고가 주장하는 ‘자연어로 된 이용 약관’이 기술적으로 기계가 인식할 수 있는 수준일 수 있다는 가능성을 시사했다. 즉, 1심 법원은 피고가 자체 소프트웨어로 이미지 내용을 분석할 수 있었다면 텍스트로 된 약관 또한 기계적으로 처리할 수 있었을 것이라는 취지로, 원고 측의 ‘기계가 판독 가능한 이용 유보’ 주장이 성립할 여지를 열어두는 듯한 태도를 보였다. 3) 일시적 복제 면책의 배제(제44a조 관련) 1심 법원은 피고가 데이터셋 제작을 위해 원고의 사진을 다운로드한 행위는 기술적 과정에서 수반되는 일시적이거나 부수적인 복제가 아니라, 데이터 분석을 위해 의도적으로 수행된 독립적인 복제 행위라고 보았다. 따라서 1심 법원은 기술적 과정의 필수적인 부분에만 적용되는 제44a조(일시적 복제)의 면책 규정은 이 사건에 적용될 수 없다고 판단했다.
항소심 법원은 원고의 사진이 적어도 저작인접권으로 보호되는 저작권법 제72조의 단순 사진(Lichtbild)으로 보호되며, 원고가 해당 사진의 작성자임을 인정하였다. 또한 피고가 사진을 다운로드한 행위는 저작권법 제16조의 복제에 해당하고, 피고가 원고의 허락이나 사진 에이전시를 통한 라이선스를 취득하지 않았다는 점도 분명히 하였다. 다만 피고가 다운로드한 파일은 에이전시 웹사이트에 광고 목적으로 게시된 워터마크가 포함된 미리보기 이미지였고, 이러한 다운로드는 저작권 제한 규정으로 정당화된다고 보았다. 즉 1심 법원은 저작권법 제60d조에 의한 정당화를 인정하면서 제44b조의 적용 여부를 열어둔 채 결론을 내렸지만, 항소심 법원은 저작권법 제44b조를 직접 적용하여 정당화를 인정하였다. 1) 저작권법 제44b조 제2항 (1) 저작권법 제44b조 적용의 출발점 법원은 저작권법 제44b조가 DSM 지침 제4조를 이행한 규정이라는 점을 확인한 뒤, 먼저 피고의 행위가 제44b조 제1항이 정의하는 TDM에 해당하는지부터 검토하였다. 법원은 이 사건의 다운로드가 단순한 수집이 아니라, 이미지 파일을 내려받아 소프트웨어로 분석하고, 기존에 준비된 텍스트 설명과 이미지 내용이 일치하는지를 검증하기 위한 목적에서 수행되었다는 점을 전제로 하였다. 그런 다음 법원은 “특히 패턴·트렌드·상관관계(Korrelationen)에 관한 정보(Information)를 얻기 위한 것”이라는 제44b조 제1항의 목적 요건을 해석하였다. 법원은 저작권법 제44b조 제1항이 단일 저작물의 자동화된 분석도 명문으로 포함하고 있고, 입법이유서 역시 단일 저작물 분석을 허용한다고 설명하면서, 이 사건처럼 개별 이미지가 하나씩 처리되는 형태라 하여 곧바로 TDM 성격이 부정되지 않는다고 하였다. 특히 법원은, 이미지와 텍스트 설명이 일치하는지를 판정하는 행위가 통계학적 의미에서의 상관관계 개념에 정확히 들어맞는지에 관하여 원고가 다툰 점을 의식하면서도, 법률상 ‘상관관계’는 예시적 개념에 불과하고, 최소한 이미지와 설명 사이의 ‘일치/불일치’ 판단은 양자 간 관계에 관한 정보를 얻는 것이므로 저작권법 제44b조 제1항이 말하는 ‘정보 획득’에 해당한다고 보았다. 법원은 더 나아가 설령 엄격한 의미의 상관관계를 부정하더라도 이미지-텍스트의 관계는 ‘기타 정보’로 포섭될 수 있다고 보았다. (2) AI 학습과의 관계 법원은 원고가 저작권법 제44b조 (및 DSM 지침 제4조)가 애초에 생성형 AI 학습을 전제로 한 규정이 아니며, “정신적 창작 내용 자체를 활용해 경쟁 산출물을 만드는” AI 학습에는 적용되면 안 된다고 주장한 점을 정면으로 다루었다. 이에 대해 법원은, 독일 입법자가 저작권법 제44b조를 도입하면서 머신러닝이 AI의 기초 기술로서 중요하다는 점을 입법 이유에서 분명히 밝히고 있다는 점을 근거로, TDM 규정이 AI 관련 활용을 배제해야 한다는 해석은 타당하지 않다고 보았다. 또한 법원은 EU 차원에서도 AI 학습과 TDM의 opt-out(권리유보)의 관계가 이미 규범적으로 접합되어 있다는 점을 강조하였다. 특히 EU 인공지능법(AI Act) 제53조 제1항 (c)가 “DSM 지침 제4조 제3항의 권리유보를 식별하고 준수하기 위한 전략”을 요구하는 규정임을 지적하면서, 이는 유럽 입법자가 TDM 규정이 AI 모델과 무관하다고 보지 않는다는 강한 간접 근거로 기능한다고 설명하였다. 그 결과 법원은, 이 사건에서 저작권법 제44b조 제1항의 요건 충족 여부를 판단함에 있어 “나중에 이 데이터셋이 생성형 AI 학습에 활용될 수 있다”는 사정을 들어 TDM 자체를 부정할 수 없다고 하였다. 법원은 오히려, 학습을 통한 시장 영향 등은 “요건 단계”가 아니라 3단계 테스트 단계에서 평가될 사안이라고 하였다. (3) 병렬 아카이브(Parallel Archive) 금지 주장과의 관계 원고는 입법 이유가 “디지털 병렬 아카이브를 만들기 위한 단순 수집·저장”은 TDM 범위에서 배제된다고 한 점을 들어 피고의 행위가 그에 해당한다고 주장하였다. 그러나 법원은, 이 사건의 데이터셋에는 이미지 파일이 저장되지 않고, 링크와 메타데이터만 포함된다는 1심의 사실인정이 항소심에서 다투어지지 않았음을 근거로, 이 사건을 병렬 아카이브 구축으로 볼 수 없다고 하였다. 따라서 입법 이유에서 배제 사례를 원용해 제44b조의 적용을 배제할 수 없다고 하였다. 또한 법원은 원고가 별도로 저작권법 제44b조 제2항 제2문의 삭제청구(삭제 의무)를 구하지 않고 있다는 점도 언급하면서, 이 소송의 심리 대상은 어디까지나 다운로드 복제의 위법성 여부임을 분명히 했다. 2) 저작권법 제44b조 제3항: 이용 유보(Opt-out)와 기계식별가능성(maschinenlesbar) 요건 (1) 입증책임의 구조: ‘유보 부존재’는 이용자, ‘기계판독성은 권리자 법원은 제44b조 제3항 제1문이 “유보가 없을 때만” 허용된다는 구조이므로, 원칙적으로 이용자가 유보가 없음을 전제로 하는 요건을 주장·입증해야 한다고 보았다. 다만 권리자도 소극적 사실에 관한 정보 우위가 있을 수 있으므로, 권리자에게는 2차적 주장책임이 부과될 수 있다고 정리하였다. 그런데 법원은 여기서 한 걸음 더 나아가, 제44b조 제3항 제2문이 “기계가 판독 가능한 형식일 때만 유효”라는 방식으로 규정되어 있는 점을 근거로, 기계판독성은 권리자 쪽에서 주장·입증해야 할 요소라고 보았다. 그리하여 법원은 최소한 권리자 측이 “해당 시점에 기술적으로 가능했는지”에 대해 설명해야 한다고 밝혔다. (2) 권리자 귀속 문제 원고의 사진이 에이전시 웹사이트에 게시된 점 때문에, 설령 이용 유보가 존재하더라도 그것이 권리자의 유보로 볼 수 있는지가 문제될 수 있었다. 법원은 DSM 지침 제4조와 저작권법 제44b조의 실효성(effet utile)을 고려하여, 단순이용권자 (즉 비독점적 이용권자)가 운영하는 사이트에 접근하는 경우에도, 그 사이트가 권리자의 동의 아래 저작물을 유통하는 구조라면 사이트 운영자가 표방한 유보를 전혀 무시할 수는 없다고 보았다. 나아가 원고가 자신의 사진을 유통하기 위해 에이전시를 활용하는 통상적 거래 구조상, 에이전시가 설정한 이용 조건은 원고에게도 일정 부분 귀속될 수 있다는 점을 지적하였다. 다만 법원은, 이 사건에서는 결국 귀속 가능성 자체가 결정적 쟁점이 되기보다, 설령 유보의 주체 문제를 원고에게 유리하게 보더라도 기계판독성 요건이 충족되지 않는다는 이유로 이용유보(opt-out)의 효력을 부정하는 구조를 취하였다. (3) 이용유보의 내용 해석 법원은 이용약관 문구가 TDM을 명시적으로 언급하지 않더라도, 자동화 프로그램을 통한 접근·다운로드·스크래핑 등을 포괄적으로 금지하는 문언은 그 성질상 데이터 마이닝을 겨냥한 금지로 해석될 수 있다고 보았다. 따라서 이 사건에서 문제된 다운로드(이미지-텍스트 비교를 위한 자동 다운로드)도 그 문언이 겨냥하는 범위에 포함될 수 있다고 전제하였다. 하지만 법원은 기계판독성 판단에서 무엇보다 시간적 기준시점을 명확히 했다. 문제된 다운로드가 이루어진 시점은 ’2021년 하반기이므로, 기계판독성도 그 시점에서의 기술·시장 상황을 기준으로 판단해야 하며, 이후 발전한 기술(예: 2023년 이후의 도구나 모델)을 근거로 소급하여 기계판독성을 인정할 수 없다고 하였다. (4) 원고 주장·증거 부족: 자연어 약관, ChatGPT의 산출물, weboptout 언급의 한계 법원은 원고가 제시한 근거들을 개별적으로 검토하여 모두 “2021년 당시의 기계판독성”을 뒷받침하지 못한다고 보았다. 원고는 (i) 이용약관이 자연어로 존재하고, (ii) 그 텍스트를 특정 도구로 읽어낼 수 있으며, (iii) ChatGPT에 입력해 의미를 파악할 수 있다는 취지로 주장했으나, 법원은 ChatGPT가 2022년 말 이후 공개된 점을 들어 2021년 당시 가능성을 입증하는 자료가 될 수 없다고 하였다. 또한 웹 옵트아웃 (web opt-out) 같은 도구를 언급하더라도 그것이 2021년에 사용 가능했는지, 또는 2021년 당시 통상적·비례적인 비용으로 자동 검출이 가능했는지에 대한 구체적 주장이 부족하다고 보았다. 나아가서 법원은, 설령 피고가 이미지와 텍스트를 비교하는 소프트웨어를 사용했다는 사실만으로 “약관 전체를 읽고 의미를 해석해 옵트아웃(Opt-out)으로 작동시키는 자연어 이해”가 2021년에 가능했다는 결론으로 곧바로 연결할 수 없다고 선을 그었다. 특히 이 사건의 약관 문구는 TDM을 명시하지 않아 해석을 필요로 하는데, 그러한 해석까지 자동으로 수행할 수 있는 기계적 텍스트 이해 능력이 2021년에 존재했다는 점이 주장·입증되지 않았다고 강조하였다. 마지막으로 원고가 1심 변론 종결 후 제출한 서면에서 “개발자라면 2021년에도 몇 시간 내 구현 가능”과 같은 주장을 하였으나, 법원은 이는 민사소송법 제296a조(변론종결 후 제출서면의 배제)에 따라 절차적으로 고려할 수 없고, 항소심에서도 민사소송법 제531조 제2항의 요건을 충족하지 못하므로 새로운 주장으로 채택될 수 없다고 하였다. 그 결과 이 사건에서 옵트아웃(Opt-out)은 기계판독성 요건을 충족하지 못하여 효력이 부정되었다. 이 결론에 따라 법원은, “만약 시장에 존재하는 프로그램으로 읽히지 않는다면 이용자가 자체 프로그램을 개발해야 하는가”라는 추가 문제는 더 이상 판단할 필요가 없다고 하였다. 3) 저작권법 제44b조에도 3단계 테스트 적용 법원은 저작권법 제44b조에 의한 이용도 정보사회지침 제5조 제5항에 따른 3단계 테스트의 통제를 받는다고 보았다(근거규정: DSM 지침 제7조 제2항). 그리고 3단계 테스트가 단순한 입법자 지침에 그치지 않고, 개별 사안에서 법원이 적용해야 하는 판단기준임도 확인하였다. 법원은 이 사건이 단순 사진(저작권법 제72조)이라는 점을 전제로 하면서도, 제72조 제1항에 의해 관련 규정이 준용되고, 지침에 합치적인 해석이 요청되는 이상 3단계 테스트 역시 적용된다고 정리하였다. 그다음 법원은 3단계 테스트의 각 요소를 사안에 접목시켰는데, 특히 정상적 이용(normal exploitation)의 침해 여부 판단에서 문제된 복제가 피고 내부에서만 이루어지는 일회적·기술적 복제이고, 외부에 공개된 데이터셋에는 이미지가 포함되지 않으며 정당한 출처로 연결되는 링크만 존재한다는 점을 중요한 사정으로 삼았다. 법원은 원고가 “AI가 사진작가를 대체할 수 있다”는 식으로 거시적 시장 효과를 주장하더라도, 이 사건에서 다투는 행위는 어디까지나 데이터셋 제작 과정의 내부적 복제이고, 그 자체가 원고의 1차 시장(라이선스 시장)과 직접 경쟁하는 이용 형태로 평가되기는 어렵다는 방향으로 논리를 전개하였다. 또한 법원은 제44b조가 원칙적으로 무상 허용 구조를 취하고 있다는 점을 “이 사건에서 별도로 보상받지 못한다”는 사정의 법적 의미로 정리하면서, 이는 개별 사건에서 법원이 임의로 뒤집을 문제가 아니라 입법자가 선택한 구조의 결과라고 덧붙였다. 4) 저작권법 제60d조 판단 항소심은 1심이 인정한 제60d조(연구 목적 TDM)도 충족된다고 판단하였다. 법원은 제60d조 제2항의 연구단체의 정의와 비영리 요건을 제시하고, 과학적 연구의 의미를 “검증 가능한 방식으로 새로운 지식을 얻기 위한 활동으로 넓게 보면서, 자연과학뿐 아니라 광범위한 학문 영역이 포함된다고 하였다. 또한 법원은 데이터셋을 공개해 기업도 사용할 수 있게 한 점만으로 ‘상업적 목적’을 인정할 수 없고, 피고가 자체적 이익을 추구하지 않으며 공개 제공이라는 방식으로 EU 및 독일의 경쟁력 저하 위험에 대응하려 한다는 취지의 설명을 들어 비영리성을 긍정하였다. 원고가 특히 문제 삼은 것은 제60d조 제2항 제3문(민간기업이 지배적인 영향을 미치고 연구결과에 우선 접근하는 경우의 배제)였는데, 법원은 이 배제요건이 충접적 요건이며, 단순한 협업이나 간접적 지원만으로 바로 배제되지 않는다고 하였다. 그리고 원고가 제기한 Stable Diffusion 활용, 특정 기업과의 연계, 구성원의 고용관계 등 개별 사정을 검토하되, 그것만으로는 “지배적 영향”을 인정하기 어렵다고 판단하였다. 5) 부수적 판단: 일시적 복제 부정 및 상고허가 법원은 이 사건에서 저작권법 제44a조(일시적 복제)까지 판단할 필요는 없다고 하면서도, 1심이 제44a조의 적용을 부정한 것은 정당하다고 확인하였다. 즉, 특정 소프트웨어로 분석하기 위해 의도적으로 이미지를 다운로드하는 행위는 “일시적·부수적 복제”로 보기 어렵다고 보았다. 마지막으로 항소심 법원은 원고의 항소를 기각하고, 이 사건이 AI 학습 전 단계에서의 저작권법 제44b조와 제60d조의 해석이라는 점에서 최고법원 판례가 없고 실무적 파급력이 크다는 이유로 연방대법원(BGH)에 상고를 허가하였다.
함부르크 고등법원은 AI 모델 학습을 위한 데이터셋 제작 행위가 텍스트 및 데이터 마이닝(TDM) 면책 규정(저작권법 제44b조, 제60d조)의 적용 대상임을 분명히 했다. 이는 유럽연합의 AI법(AI Act) 및 다수설과 일치하는 판단으로, AI 개발자들에게 상당한 법적 확실성을 제공했다. 특히 과학적 연구(제60d조)와 관련하여, 상업적 기업으로부터 자금 지원이나 인적 교류가 있더라도 연구 기관으로서의 지위를 상실하지 않는다는 점을 명시함으로써 AI 연구의 입지를 한층 강화했다. 법원은 쟁점이 된 ‘기계 판독 가능성’을 단순한 인식 가능성을 넘어, 기계가 즉각적으로 조치를 취할 수 있는 ‘실행 가능성(machine-actionable)’으로 정의했다. 즉, 자동화된 프로세스가 텍스트를 해석하고 크롤링 중단 등의 조치를 스스로 실행할 수 있어야 한다는 것이다. 이에 따라 법원은 자연어(Natural Language)로 된 이용 약관은 2021년의 기술 수준에서 자동화된 처리가 불가능하므로, 유효한 이용 유보(Opt-out) 수단으로 볼 수 없다고 판단했다. 입증책임의 분배와 관련하여서는, 이용자(데이터 수집가)가 이용 유보의 부존재를 입증해야 하는 반면, 권리자는 자신이 설정한 이용 유보가 ‘당시 기술 수준에서 기계 판독 가능했음’을 입증해야 한다는 원칙을 세웠다. 이는 향후 유사 소송에서 권리자에게 상당한 부담으로 작용할 전망이다. 한편, 법원의 판단은 2021년 하반기의 기술 수준을 기준으로 한다는 점에서 한계를 가진다. 거대언어모델(LLM)이 보편화된 2025년 현재, 자연어 약관을 기계가 해석할 수 있는지에 대해서는 명확한 답을 제시하지 않았다. 또한 법적 경계는 명확히 했으나, 이를 기술적으로 구현할 공유된 표준(Vocabulary)의 부재는 여전하다. 기계가 권리유보를 정확히 실행하려면(Actionable), ‘AI 학습 금지’, ‘검색 허용’ 등 합의된 용어 정의가 필수적이기 때문이다. 다만 법원이 사안의 중요성을 고려해 상고를 허용했으므로, 이 사건은 독일 연방법원(BGH)에서 최종적으로 다루어질 가능성이 크며, 그전까지는 이번 판결이 사실상의 가이드라인 역할을 할 것으로 보인다. 법원이 ‘기계 판독 가능성’의 구체적 기술 표준을 지정하지 않았기에, 시장에서는 다양한 표준들이 경쟁하게 될 것이다. 현재 국제 인터넷 표준화 기구(IETF)의 표준화 작업은 정체된 상태이며, 대신 Cloudflare나 RSL(Really Simple Licensing) 등 기업 주도의 독자적인 프로토콜이 등장하고 있다. 만약 개방적이고 공통된 표준(Open Standards)이 정립되지 않는다면, 플랫폼이나 중개자가 주도하는 폐쇄적인 이용 유보 시스템이 자리 잡을 수 있다. 이는 웹의 개방성을 저해하고, 데이터 접근 시 비용을 지불해야 하는 구조(pay-per-crawl)가 고착화될 위험을 내포한다. 결론적으로 이번 판결은 AI 개발자에게 TDM 면책의 적용과 입증책임의 완화라는 혜택을 부여했으나, 동시에 ‘어떤 기술적 표준으로 이용 유보를 해야 하는가’라는 과제를 남겼다. 향후 BGH의 판결과 기술 표준화 동향(robots.txt의 진화 등)이 이 쟁점의 최종 향방을 결정할 것으로 보인다.
OLG Hamburg, Urteil vom 10.12.2025 – 5 U 104/24 (https://www.itm.nrw/wp-content/uploads/2025/12/5-u-104-24.pdf) Kühn/Voges, Erstellung von KI-Trainingsdatenset als Text- und Datamining, GRUR-Prax 2025, 834. Keller, Paul, LAION Round 2: Machine-Readable but Still Not Actionable - The Lack of Progress on TDM Opt-Outs - Part 1, December 17, 2025 Keller, Paul, LAION Round 2: Machine-Readable but Still Not Actionable - The Lack of Progress on TDM Opt-Outs - Part 2, December 18, 2025 박희영, 생성형 인공지능 모델 학습과 TDM 제한 – 함부르크 지방법원 판결(Kneschke vs. LAION)-, 이슈리포트 2024-28, 한국저작권위원회
|
||||||||||
| 이전글 | [이슈리포트] 2025-제17-[미국] 미국에서의 AI 저작권 소송(1)(이대희) |
|---|---|
| 다음글 | 2025 저작권 동향 통권 |