월스트리트저널은 29일(현지 시간) ‘세상에, 누가 오픈AI에서 뭔가를 훔쳤다구요?’라는 제목의 기사를 통해 오픈AI와 중국 AI 기업 딥시크(DeepSeek) 간의 데이터를 둘러싼 논란을 보도했다. 오픈AI가 딥시크가 챗GPT에서 데이터를 무단으로 가져갔는지에 대해 조사 중이라는 발표를 했다.
조안나 스턴 기자는 오픈AI가 영화배우 스칼렛 요한슨의 목소리를 무단으로 사용한 사례를 들어, 오픈AI가 남의 자산을 바탕으로 챗GPT를 구축한 것 아니냐는 의혹을 제기했다. 뉴욕타임스도 비슷한 논조를 보이며 오픈AI와 마이크로소프트를 상대로 신문 기사를 불법적으로 이용해 AI 시스템을 훈련했다는 이유로 소송을 제기한 상태다. 현재까지 비슷한 소송만 12건이 넘는다.
뉴욕타임스는 오픈AI가 유튜브 영상에서 대화 텍스트를 추출해 AI를 훈련했다고 보도한 바 있다. 이에 오픈AI 일부 직원들은 이러한 행위가 유튜브 이용 약관에 어긋날 수 있다는 우려를 제기했다. 반면, 미국 전 트럼프 대통령의 AI 정책 자문관 데이비드 삭스는 딥시크가 디스틸레이션(distillation) 기법을 이용해 챗GPT를 모방했다고 주장했다. 오픈AI가 말하는 ‘데이터 훔치기’와 디스틸레이션은 약간 다른 개념이다.
AI 개발 전쟁은 점차 난타전 양상으로 치닫고 있다. 오픈AI와 무명 딥시크 간의 싸움은 이러한 양상을 더욱 부각시키고 있다. 한편 한국 IT 기업들은 이에 대해 조용한 행보를 보이고 있다.
* 이 기사는 2025년 01월 30일, 12:01 게재된 것으로, 요약해 재전송합니다. 원문 보기 ⇒