[블록미디어] 미국과 중국 간 인공지능(AI) 경쟁이 치열한 가운데, 중국 AI 스타트업 딥시크(DeepSeek)가 챗GPT의 아성을 위협하고 있다고 23일(현지 시간) 뉴욕타임스(NYT)가 보도했다.
NYT는 딥시크가 첨단 그래픽처리장치(GPU)를 적게 사용하면서 고성능 AI 모델을 개발했다고 보도했다.
딥시크는 대언어모델(LLM) 훈련에 미국 기술기업보다 적은 GPU를 사용했다. 이로 인해 미국의 AI 칩 수출 규제가 무력화될 수 있는 가능성이 제기됐다.
NYT는 딥시크가 오픈AI와 구글 등 거대 기업과 견줄만한 챗봇을 개발하며, 수출 규제의 한계를 보여줬다고 분석했다.
딥시크는 ‘딥시크-V3’를 개발했으며, 비용은 557만 6천 달러(약 78억 8천만 원)로 저렴했다. 이는 H800 GPU를 2달러에 시간당 대여해 2개월간 사용한 금액이다. 이는 메타의 라마(Llama)3 모델 훈련 비용의 10분의 1 수준이다.
안드레이 카르파티 오픈AI 공동창업자는 엑스(X·옛 트위터)에 딥시크의 기술 보고서를 읽고 “농담 같은 예산”으로 LLM 출시를 가능케 한 점을 높이 평가했다.
파이낸셜타임스(FT)도 딥시크가 미국의 수출규제를 극복하며 혁신적인 AI 모델을 개발했다는 점을 강조했다. 블룸버그 칼럼에서는 딥시크-V3가 대규모 칩에 의존하지 않고도 뛰어난 성능을 발휘해, 무역 전쟁에서 딥시크의 혁신이 중요한 이유임을 지적했다.
포브스는 딥시크의 ‘R1’ 추론 AI 모델이 챗GPT의 ‘o1’을 성능 테스트에서 능가한 점에 주목했다. 딥시크의 R1은 미국 수학경시대회 벤치마크 테스트와 코딩 평가에서 더 높은 점수를 기록했다.
딥시크의 기술 보고서에 따르면, R1은 전체 매개변수 중 일부만 사용하여 효율적으로 성능을 극대화했다. 이는 중국 AI 업계의 가격 인하 경쟁을 촉발할 가능성도 있다.
같이 보면 좋은 기사