한국저작권위원회

전체 메뉴

저작권동향

저작권동향 상세보기

제목

[이슈리포트] 2024-32-[미국] 언론사 Raw Story와 AlterNet이 OpenAI를 상대로 제기한 저작권 침해 소송 각하(차상육)

담당부서

국제통상협력팀 손휘용(0557920089)

등록일

2024-12-10

첨부문서

[이슈리포트] 2024-32-[미국] 언론사 Raw Story와 AlterNet이 OpenAI를 상대로 제기한 저작권 침해 소송 각하(차상육).pdf 미리보기

[미국] 언론사 Raw Story와 AlterNet이 OpenAI를 상대로 제기한 저작권 침해 소송 각하

- Raw Story Media, Inc. et al v. OpenAI Inc. et al 사건

경북대학교 법학전문대학원 교수

차상육

1. 개요

2024년 2월, Raw Story와 AlterNet 등 이 사건의 원고들은 피고 OpenAI가 AI 챗봇 ChatGPT 학습을 위해 원고의 저작물을 허락 없이 이용하였다고 주장하며 저작권 침해 소송을 제기하였다. 문자를 통해 전달되는 인간의 지시를 AI가 이해하도록 하고, 문자로 응답을 산출해낼 수 있도록 학습하는 과정에서 피고 OpenAI가 원고 언론사들의 기사를 무단으로 이용하고, 복제하였다고 주장한 것이다. 원고들은 소장에서 ChatGPT가 서비스 이용자들의 특정 지시에 대해 원고의 저작물의 내용을 “그대로(verbatim)” 혹은 거의 그대로 복제한 답변을 산출한다고 지적하였다.

다만, 저작권 침해에 대한 직접적 증거를 제출하지는 못하였고, 저작권 관리정보(copyright management information, CMI)를 임의로 삭제한 것에 대한 소송을 제기하였다.

2024년 11월, 뉴욕 연방지방법원은 해당 소송을 기각하였다. 법원은 소송을 뒷받침할 만큼 충분한 피해를 입증하지 못했다고 보았다. 또한 법원은 원고의 피해 주장의 핵심이 “CMI 삭제”가 아닌 “AI 학습에 저작물을 무단으로 이용한 사실”이라는 것을 언급하며, 그런 피해에 대한 문제는 법원에 제기되지 않았음을 지적했다.

아래에서는 해당 사건의 주요내용을 살펴보고 시사점을 도출하고자 한다.

2. 사실관계

원고들은 수십만 개의 기사와 의견을 공동으로 게시하는 언론사들이다. 그들은 OpenAI가 ChatGPT를 훈련하기 전에 저작권이 있는 작품(저작물)의 학습 데이터 세트에서 저작자 및 제목 정보 등과 같은 수반된 CMI를 제거하였다고 주장하였다. 또 원고들에 따르면 최소 3개의 학습용 데이터세트(WebText, WebText2, 및 Common Crawl)는 ChatGPT를 훈련하는 데 중요한 역할을 했다고 주장하였다.

원고들은 CMI 제거가 DMCA 제1202조(b)(i)항 위반이라고 주장했다. 이 조항은 저작권 침해를 용이하게 할 것이라는 사실을 알면서 CMI를 의도적으로 제거하거나 변경하는 것을 금지한다.

원고들은 침해금지 및 손해배상을 모두 청구하였다. 다만, 피고측이 ChatGPT를 학습 내지 훈련하기 위해 원고들의 뉴스 기사를 사용한 것이 자신의 콘텐츠를 불법 복제한 것이거나 ChatGPT의 출력이 원고들의 저작권을 침해하였다는 주장은 하지 않았다.

한편 피고 OpenAI 측은 이 사건 청구에 대해 소 각하(motion to dismiss)를 요구하면서, 원고는 제3조(The Article III standing issue)에 따라 당사자적격이 없다고 주장했다. 이에 대한 반박으로 원고들은 두 가지 필수적 이유로 당사자적격이 있다고 주장했다. 즉, 첫째, "저작권이 있는 작품에서 CMI를 불법적으로 제거하는 것은 구체적인 손해"이기 때문이고, 둘째 ChatGPT가 "원고의 저작권으로 보호되는 작품의 자료를 통합하거나 저작권으로 보호되는 작품을 그대로 또는 거의 그대로 되뇌는 사용자에게 응답을 제공할" 상당한 위험이 있기 때문이다.

원고들(Alternet과 Raw Story)의 소송은 DMCA에 초점을 맞춘 것이다. 원고들 회사는 피고 OpenAI 측이 원고측이 소유하는 수천 기사를 스크래핑하여 저자명, 작품의 이용 조건, 작품명이라고 하는 “저작권 관리 정보(CMI)'를 위법하게 삭제했다고 주장하면서 저작권 침해 1건에 대해 최소 2,500달러의 손해배상을 요구했다. 원고들은 피고 OpenAI측이 CMI를 삭제하면 저작권침해로 이어진다는 점을 인식하였다고 주장하면서, 그 이유는 ChatGPT가 적절한 출처를 나타내지 않고 기사를 요약하거나 "재현"하게 되기 때문이라고 한다. 한편, 피고 OpenAI측은 원고들에는 당사자 적격이 없다고 반론하였다. ChatGPT가 원고의 저작물로 학습된 증거도, 그러한 학습이 원고에게 손해를 끼친 증거도 나타나지 않았다고 주장했다.

뉴욕 남부 연방지방법원의 콜린 맥마혼 판사(District Judge Colleen McMahon)는 피고 OpenAI 측의 주장을 인정하고, 당사자 적격이 없다는 등의 이유로 원고의 소를 각하(dismiss) 하였다.

3. 법원의 판단

법원은 피고 OpenAI 측의 손을 들어주었는데, OpenAI는 원고가 DMCA 위반으로 인해 실제로 발생한 부정적인 영향을 주장하지 않았기 때문에 손해배상청구의 요건을 충족하지 못한다고 판단했다. 또한 피고 OpenAI측은 원고가 ChatGPT가 필요한 CMI 없이 원고의 작품을 전부 또는 일부 복제할 위험이 "상당하다"는 사실을 주장하지 못했기 때문에 금지청구 구제를 구할 자격이 없다고 주장했는데, 이에 대해 법원은 최신 버전의 ChatGPT 산출물에 원고의 작품을 침해하는 복제물이 포함될 가능성이 낮다는 의견을 바탕으로 피고측 의견에 동의했다.

원고들은 ChatGPT가 "인터넷 대부분에서 긁어온 정보"에 따라 학습 되었으며, 여기에는 거의 모든 주제에 대한 수많은 출처에서 얻은 방대한 양의 정보가 포함되어 있다고 주장한다. 원고들은 기사에 있는 정보가 저작권의 보호를 받는다고 주장한 적이 없으며 그럴 수도 없다. 사용자가 ChatGPT에 질문을 입력하면 ChatGPT는 저장소에 있는 관련 정보를 종합하여 답변으로 만든다. 저장소에 포함된 정보의 양을 감안할 때 ChatGPT가 원고들의 기사 중 하나에서 침해 콘텐츠를 출력할 가능성은 희박해 보인다. 그리고 원고들은 이전 버전의 ChatGPT가 상당한 양의 표절된 콘텐츠를 포함하는 응답을 생성했다는 것을 나타내는 제3자 통계를 제공하지만, 원고들은 현재 버전의 ChatGPT가 원고들의 기사 중 하나를 표절하는 응답을 생성할 "상당한 위험"이 있다고 그럴듯하게 주장하지 않았다.

원고가 진정으로 구제를 구하는 주장된 손해는 “피고의 학습용 데이터세트에서 CMI를 제거하는 것”이 아니라 “피고가 원고의 기사를 사용하여 원고에게 보상 없이 ChatGPT를 개발한 것”이다. 피고 OpenAI는 저작권으로 보호되는 작품을 사용하여 ChatGPT를 학습하려면 해당 콘텐츠에 대한 라이선스가 필요하다는 사실을 인지하고 인정했으며, 또한 어떤 경우에는 규모 있는 저작권자와 AI 학습을 위한 라이선스 계약을 체결한 바 있다. 유명 언론사와 같은 일부 저작권자와는 라이선스 협상을 하고, 계약을 체결하여 사용료를 지급하지만, 원고에게는 아무런 보상을 제공하지 않았다. 이에 따른 유형의 손해는 사실상 손해 요건(the injury-in-fact requirement)을 충족하는지 여부와 관계없이 DMCA 제1202(b)(i)조에 의해 "격상된"(“elevated”) 유형의 피해가 아니다. 이런 종류의 피해를 증가시키는 다른 법률이나 법적 이론이 있는지는 아직 알 수 없다. 하지만 그 문제는 법원에 제기되지 않았다.

4. 시사점

대상판결은 저작권을 침해하는 학습(training)이나 산출물(outputs)에 대한 주장없이 CMI를 제거하는 것이 ‘인지 가능한 청구’(a cognizable claim)를 제시하는지 여부를 실질적으로 판단한 미국 하급심 법원의 사례인 점에 의의가 있다. 한편 대상판결은 DMCA의 CMI 조항 위반에 대한 DMCA 청구 문제에 대한 매우 중요한 사례이지만, 향후 AI 침해 사례에서 다른 침해 청구에 대한 추가 방어 또는 AI 기반 대규모 언어 모델(large language models, ‘LLMs’)의 학습(훈련)에 대한 보다 일반적인 청구 및 방어를 우회하는 수단으로써 CMI 청구로 이어질 경우 이 판결은 훨씬 더 중요할 수 있다.

법원은 이 사건 소를 각하(dismiss)하면서, 제3조 적격 요건(손해가 "구체적이고 특정적"이어야 하며 "실제적 또는 임박적"이어야 함)을 확립하기 위한 미국의 선례 판결에서 제시한 요건에 의존했다. 당사자적격 요건은 미국법에서 잘 알려져 있고 다른 저작권 사건에서 소송이 진행되었지만, DMCA의 CMI 조항 위반에 대해 소 각하하는 데 사용된 것은 이번이 실질상 처음이라 할 수 있다.

이러한 대상판결의 판시내용은 대규모 언어 모델(LLMs)을 훈련하기 위한 CMI 제거가 ‘인지 가능한 청구’(a cognizable claim)를 발생시킬 수 있는지 여부와 관련하여 중요할 뿐만 아니라, 저작권자가 DMCA의 CMI 조항(the DMCA CMI provisions) 위반에 대한 다른 청구를 추진할 수 있는 권리와 관련하여 더 일반적으로 중요하다. 또 대상 판결은 이 사건의 원고가 대규모 언어 모델(LLMs)의 학습(훈련) 및 그 출력물이 미국 저작권법의 독점적 권리를 침해했다는 주장과 그에 대응한 항변과 같은 보다 더 어려운 법적 쟁점을 피하기 위해 DMCA CMI 권리(the DMCA CMI rights)에 대한 위반만을 주장하고 있기 때문에 향후 AI 관련 소송실무상 그 중요성이 적지 않다고 보인다.

대상판결에서 법원은 원고들(Raw Story와 Alternet)에게 소장의 수정의 기회를 제공하였는데, 결론적으로 이 사건 소 각하로 다른 법적 논점을 논의할 여지가 전혀 사라진 것은 아니다. 법관(McMahon, J. 판사)이 지적한 것은 원고 측이 주장하고 있는 것은 저작권 침해의 “가능성”에 지나지 않고 거기에는 구체적인 근거가 부족하다는 것뿐이었다. 이러한 판시내용과 같이 해당 사건에 있어 당사자 적격이 없다는 법리는 AI를 둘러싼 재판을 넘어 잠재적으로 큰 영향을 미칠 가능성이 있다고 전망된다.

참고자료

➢ https://fingfx.thomsonreuters.com/gfx/legaldocs/lbvgbwxjkpq/OPENAI%20RAW%20STORY%20LAWSUIT%20complaint.pdf

➢ https://docs.justia.com/cases/federal/district-courts/new-york/nysdce/1:2024cv01514/616533/90

➢ https://www.courthousenews.com/wp-content/uploads/2024/11/openai-motion-to-dismiss-raw-story-copyright.pdf

➢ https://casetext.com/case/raw-story-media-inc-v-openai-inc-4

이전글 다음글
이전글	2024년 제22호-[미국] 상원 사법위원회 지식재산 소위원회, 저작권청장과 함께 인공지능 기술이 저작권에 미치는 영향과 정책적 대응 방안 논의(손휘용)
다음글	[이슈리포트] 2024-33-[EU] 지역적 차단조치(Geo-Blocking) 우회를 위한 VPN 사용에 따른 공중전달권 침해 문제(이일호)

담당자 : 손휘용
담당부서 : 국제통상협력팀
전화번호 : 055-792-0089