[블록미디어 James Jung 기자] 월스트리트저널은 29일(현지 시간) “세상에, 누가 오픈AI에서 뭔가를 훔쳤다구요?(Oh Dear, Did Someone Steal Something From OpenAI?)” 라는 제목의 기사를 올렸습니다.
중국 AI 딥시크(DeepSeek)가 챗GPT에서 데이터를 가져갔는지 조사 중이라는 오픈AI의 발표에 대한 기자 칼럼입니다.
조안나 스턴 기자는 오픈AI가 영화배우 스칼렛 요한슨 목소리를 ‘무단으로’ 쓴 것을 꼬집었습니다. 오픈AI야말로 남의 것을 바탕으로 챗GPT 구축하지 않았냐는 거죠. 원죄론입니다.
뉴욕타임스도 비슷한 논조였습니다. 사실 뉴욕타임스는 오픈AI와 마이크로소프트를 상대로 소송을 하고 있습니다. 두 회사가 신문 기사를 불법적으로 이용해 AI 시스템을 훈련했다는 거에요. 비슷한 소송이 12 건이 넘습니다. 오픈AI도 도둑이라는 겁니다.
작년에 뉴욕타임스는 오픈AI가 유튜브 영상에서 대화 텍스트를 추출한 후, 이 데이터로 AI를 훈련했다고 보도했습니다. 오픈AI 일부 직원들은 이 같은 행위가 유튜브 이용 약관에 어긋날 수 있다고 우려했다는군요. 오픈AI는 딥시크가 챗GPT 약관을 어겼는지 보고 있답니다. 인과응보죠.
트럼프 대통령의 AI 정책 자문관 데이비드 삭스는 딥시크가 디스틸레이션(distillation 증류)이라는 기법을 이용해 챗GPT를 모방했다고 주장하는데요. 오픈AI가 얘기한 ‘데이터 훔치기’와 디스틸레이션은 약간 다른 개념입니다.(하단 유튜브 영상 참조)
아무튼 무단 사용, 빼가기, 훔치기, 디스틸레이션 등 AI 개발 전쟁은 피아를 구분하기 힘든 난타전이 돼 가고 있습니다.
절대 강자 오픈AI가 무명 딥시크에게 일격을 당했고, 우리는 설연휴 내내 구경만 하고 있습니다. “이기는 편 우리 편” 팝콘 모드로만 있자니, 씁쓸합니다. 한국 IT 기업들은 어디에? “넌 뭐하고 있니, 훔치기라도 해” 하고 싶은 심정입니다.
같이 보면 좋은 기사