Data Frontier에 다다른 AI 테크기업들
올 8월 유명 저자 세 사람이 Anthropic을 저작권법 위반 혐의로 고소하였으며, 그 외에도 AI Tech 기업들에 대한 저작권법 관련 집단소송이 줄을 잇는 상황입니다. 제일 유명한 사례로 작년에 New York Times가 OpenAI와 마이크로소프트를 상대로 제기한 소송이 있죠.
전문가들은 이제 AI Tech 기업들은 “data frontier(데이터 프론티어)”에 도달했다고 평가합니다. 이는, 더 이상 저작권 침해 문제로 인해 더 이상 웹 상의 데이터를 마음대로 스크래핑할 수 없으며, 이제 AI tech 기업들이 데이터를 얻기 위해서는 데이터 생산자들(출판사, 언론사 등)에게 구매하거나 스스로 합성 데이터(synthetic data)를 생산해야만 함을 의미합니다. 실제로 OpenAI는 최근 New Yorker와 Vogue 잡지의 출판사인 Conde Nast와 계약을 맺었음을 공표했다고 합니다.
[내용 출처: Financial Times, 24.08.31., https://www.ft.com/content/e6a4dcae-2bda-42de-8112-768844673cea]
AI Tech 기업들이 데이터 프론티어에 다다르면서, 생성형 AI 진화를 위한 학습은 새로운 전기를 맞이할 것 같습니다. 최근 ChatGPT 등 생성형 AI 툴의 눈부신 발전은 어찌 보면 규제가 미비한 상황에서 웹 상의 무궁무진한 데이터를 매우 낮은 비용으로 활용한 것도 한 몫을 했습니다. 이제 데이터 생산자들의 반격이 시작되면서, 학습 비용은 현저히 증가하게 되며, 비용을 회피하기 위한 전략적 행동도 이루어질 것으로 예상됩니다. 기술 발전이라는 거대한 흐름 속에서 현존하는 제도와의 긴장관계에서 발생하는 새로운 창발적 도전이 어떤 방식으로 펼쳐질지 주목해야할 이유입니다.
인공지능경제연구소(AIEconLab)는 좋은 정보의 자유로운 교류를 통한 지식 발전을 지향합니다. 동 블로그의 모든 저작물은 자유롭게 퍼나르셔도 됩니다만, 출처를 밝혀주시면 감사하겠습니다. (출처: 인공지능경제연구소(AIEconLab) 블로그(aieconlab.com))