체리마스터 릴게임 ω 바다이야기사이트먹튀 ω > 자유게시판

본문 바로가기
사이트 내 전체검색


회원로그인

포인트충전
자유게시판

체리마스터 릴게임 ω 바다이야기사이트먹튀 ω

페이지 정보

작성자 즙수병햇 작성일25-03-08 01:53 조회81회 댓글0건

본문

슬롯버그 ❡ 황금성게임다운 ❡▥ 26.rzc476.top ♀ICT(정보통신기술), 플랫폼 기업들이 잇달아 생성형 AI를 내놓으면서 생성형 AI 고도화의 핵심인 '학습' 과정에서 저작권 침해 논란이 일고 있다. 해외에서 언론사 등 콘텐츠 제작자들을 중심으로 AI 저작권 소송이 잇따르는 가운데 국내 뉴스 생태계를 좌지우지하는 네이버 역시 AI 저작권 논란에서 자유롭지 않은 상황이다. 네이버 AI의 뉴스 저작권 침해 상황과 건강한 AI-뉴스 생태계 조성을 위한 개선 방안을 짚어본다. <편집자 주>



국회 과학기술정보방송통신위원회 전체회의가 열린 2024년 11월 26일 최민희 과방위원장이 인공지능(AI) 기본법 제정안을 상정하고 있다.ⓒ연합뉴스


항공사 순위 네이버와 같은 생성형AI 모델을 운영하는 기업이 AI(인공지능) 학습을 이유로 언론사 저작물을 무단으로 사용한 것을 두고 언론사들이 소송전에 돌입한 가운데 업계가 결과에 촉각을 곤두세우고 있다. 국내 방송 3사, 한국신문협회 등 언론단체가 문제 삼고 있는 저작권 침해가 어디까지 인정되고, 보상은 어떻게 산정되느냐에 따라 IT 뿐 아니라 전체 재택부업 산업에 영향을 미치기 때문이다.
전문가들은 네이버-언론사라는 사업자간 갈등으로만 볼 것이 아니라 생성형 AI 및 저널리즘 가치 제고라는 국가 산업 발전을 위해서라도 정부 주도로 구체적인 가이드라인을 제시해야 한다고 주장한다. 'AI 3대 강국'을 표방하는 한국이 AI 기술 경쟁력을 확보하기 위해서는 반드시 짚고 넘어가야 할 중대사안이라고도 일반대출금리 강조한다.
7일 업계에 따르면 최근 네이버에 저작권 침해를 이유로 소송을 제기한 방송 3사·한국신문협회 의견을 종합하면 네이버가 침해를 인정하고 대책 마련을 위해 전향적으로 나서야 한다고 요구한다.
저작권 침해 이유로 신문협회는 2021년 9월 코넬대학교 arXiv(아카이브)에 게시된 논문 '대규모 언어 모델이 가져올 미즈사랑 무직자 변화는 무엇인가? 하이퍼클로바에 대한 집중 연구(What Changes Can Large-scale Language Models Bring? Intensive Study on HyperCLOVA)'를 근거로 든다. 해당 논문은 네이버가 자체 개발한 생성형AI 모델인 하이퍼클로바의 사전훈련 데이터를 다루고 있다.
논문은 하이퍼클로바가 AI (주)해드림 학습을 위해 사용한 뉴스데이터(news corpus·대량의 뉴스 기사 데이터 모음)가 738억 토큰으로 전체(5618억 토큰)의 13%에 해당한다고 설명한다. 블로그(49%), 커뮤니티 사이트(15%)에 이어 세 번째로 많다. 언론사들이 자사 기사가 AI 학습에 무단으로 사용됐음을 문제 삼는 배경이다.
또한 뉴스를 포함한 다양한 데이터 수집 경로가 '네이버 및 외부 출처(external sources)'인 점, 뉴스 데이터 전처리(Preprocessing)로 뉴스 데이터에서 특정 부분(첫 줄과 마지막 문구)을 제거했다는 점도 저작권과 관련한 논란의 소지가 있다
언론사들이 자사 기사인지를 확인할 수 없는 상황에서 네이버가 AI 학습을 위해 뉴스를 활용했다면 저작권 침해로 볼 수 있다는 것이다. 따라서 'AI 학습이 저작권 침해인지', '출처를 삭제한 것이 생성형AI 훈련에 문제가 없는지' 등이 쟁점이 될 것으로 보인다.
비슷한 이유로 뉴욕타임스가 오픈AI와 마이크로소프트에 저작권 침해 소송을 낸 상황이어서, 네이버는 이를 참고할 가능성이 높다. 앞서 뉴욕타임스는 2023년 소송을 제기하며 수백만 건의 자사 기사가 챗GPT 등 AI 모델 훈련에 무단으로 사용됐으며, 이는 무임승차라고 했다.
유의미한 해외 판례가 아직 나오지 않았고, 상당한 뉴스 콘텐츠 계약 비용도 고려할 때 네이버는 법적으로 쟁점이 해소될 때까지 관망 모드를 지속할 것이라는 관측이 나온다.



2021년 9월 코넬대학교 arXiv에 게시된 논문 '대규모 언어 모델이 가져올 변화는 무엇인가? 하이퍼클로바에 대한 집중 연구(What Changes Can Large-scale Language Models Bring? Intensive Study on HyperCLOVA)' 캡처


이같은 네이버-언론사간 줄다리기는 AI 산업 발전 측면에서 그리 좋지 못한 신호라는 것이 업계의 지적이다. 생성형AI 경쟁력 제고를 위해 빅테크들이 수 조원의 금액을 쏟아부으며 데이터를 수집·훈련하고 데이터센터 구축에 나서는 상황에서, 네이버와 언론사가 소송에 얽매여 적지 않은 시간과 비용을 낭비하는 것은 국내 산업을 후퇴시키고 있다는 주장이다.
특히 공정위 제소의 경우 AI 학습으로 인해 '피해를 입었다'는 증거를 제시해야 하는 만큼 과정이 복잡하고 오래 걸릴 수 있다. 민사 소송이어도 어느 한 쪽이 불복한다면 수 년간 소송전을 치러야 해 상처 뿐인 영광이 될 수 있다. 승소한 언론사만 수혜를 누리고 타사는 불이익을 받는 불공정 우려도 존재한다.
이런 측면에서 전문가들을 중심으로 정부가 AI 산업 육성과 저작권 보호의 양 측면에서 적극적으로 개입해야 한다는 주장이 나온다. 'AI 3대 강국' 실현을 위해 기업·언론사가 협력해도 모자른 상황에서 소송 등 소모전만 펼치는 것은 산업적으로나 국가적으로나 큰 손해라는 지적이다.
이성엽 고려대 기술경영전문대학원 교수는 "저작권이 설정돼있으니 일방적으로 아무런 대가 없이 사용하는 것은 법리상 맞지 않다"면서도 "AI가 크롤링(웹사이트의 데이터를 자동으로 수집하는 기술)으로 데이터를 수집하는 것은 사람이 남의 저작물을 쓰는 것과 다른 것도 구별해야 한다"고 말했다.
이 교수는 "이를 허용하려면 공정 이용(fair use) 조항으로 면책을 한다던가, 텍스트 및 데이터 마이닝(TDM·Text & Data Mining) 면책을 도입하는 것이 필요하다"고 설명했다.
공정 이용이란 저작권이 있는 콘텐츠라도, 특정 조건을 충족하면 허락 없이 사용할 수 있는 법적 개념을 말하며 TMD 면책은 정보분석 등의 목적으로 AI가 데이터를 이용하는 경우 저작권자의 저작물을 AI 학습용 데이터로 사용할 수 있도록 저작권 침해 책임을 면해 주는 것을 뜻한다.



오픈AI 챗GPT 로고.ⓒ연합뉴스


이번 분쟁을 단순히 사업자간 갈등으로 바라볼 것이 아니라 AI 생태계 발전 및 국익 차원에서 접근해야 한다는 조언도 제기됐다.
이봉의 서울대 법학전문대학원 교수는 "국가적으로 여러 데이터센터를 짓는다고 하더라도 처리할 데이터가 필요하다. 우리는 영어권 등에 비해 학습데이터가 부족한 상황"이라며 "정부가 각 언론사단체, 플랫폼 기업들과 포괄적 합의를 하고 필요한 경우 일정 부분 예산 지원을 해 데이터 문제가 더 이상 장애물로 작용하지 않도록 해야 한다"고 조언했다.
여기서 'AI 기본법'은 과학기술정보통신부가, 저작권법은 문화체육관광부가 주무부처인만큼 분쟁 해결을 위해 적극 나설 필요가 있다는 주장이다.
신문협회는 지난달 말 ‘인공지능 발전과 신뢰 기반 조성 등에 관한 기본법’(이하 AI 기본법)과 ‘저작권법’ 개정 의견을 국회와 정부 등에 각각 제출하고, 뉴스 저작권 침해 방지 관련 조항을 보완할 것을 요구했다.
작년 말 제정된 AI 기본법은 정부가 AI 산업의 지원 근거와 기준 신뢰 기반 조성에 관한 사항을 규정하고 있으나 AI 학습 데이터 기록 보관 및 공개 등의 규정은 빠져 보완 입법이 필요하다는 의견이 나오고 있다.

댓글목록

등록된 댓글이 없습니다.


접속자집계

오늘
990
어제
1,598
최대
3,171
전체
1,676,848
 |  개인정보처리방침 |  이용약관 |  모바일버전 ↑TOP
고객센터:070-4351-6736 | E-mail:winjswin@hanmail.net
(주)포스트에코존 | 대표이사:원미선 |사업자번호:582-86-00807 | 통신판매업신고번호: 제2014-서울강동-0239호 | 출판사신고번호: 제 2018-000006호
서울특별시 강동구 양재대로 1393, 2층 215호(성내동)
Copyright © PAPATOON. All rights reserved.