[블록미디어] 중국 인공지능(AI) 기업 딥시크(DeepSeek)를 이끌고 있는 량원펑(梁文锋)은 퀀트트래이딩 회사에서 출발, 챗GPT에 맞먹는 AI 개발자로 변신했습니다.
중국 내에서도 량원펑은 언론 노출이 많지 않은데요. 지난해 7월 중국의 한 매체(暗涌Waves)는 장문의 인터뷰 기사를 게재했습니다.
당시 딥시크는 중국의 대형 AI 기업들과 다른 행보로 주목 받고 있었는데요. 블록미디어가 해당 인터뷰 원문을 구해 요약했습니다. 중국어 원문을 한글로 바꾸는데는 딥시크와 챗GPT를 모두 사용했습니다. 인터뷰 기사 1에서 이어집니다.
AI는 누구나 쓸 수 있어야
질문 : 외부에서는 가격 인하가 사용자를 확보하기 위한 것처럼 보입니다. 인터넷 시대의 가격 전쟁은 보통 그렇죠.
량원펑 : 사용자 확보가 우리의 주요 목적은 아닙니다. 우리가 가격을 내린 이유는 한편으로는 차세대 모델 구조를 탐구하면서 비용이 먼저 줄어들었기 때문이고, 다른 한편으로는 API나 AI가 모두 보편적이고 누구나 사용할 수 있는 것이어야 한다고 생각했기 때문입니다.
질문 : 이전에는 대부분의 중국 회사들이 Llama 구조를 그대로 복사해 응용을 만들었습니다. 왜 당신들은 모델 구조부터 시작했나요?
량원펑 : 목표가 응용을 만드는 것이라면, Llama 구조를 그대로 사용해 빠르게 제품을 출시하는 것도 합리적인 선택입니다. 하지만 우리의 목적지는 AGI(일반 인공지능)입니다. 이는 우리가 새로운 모델 구조를 연구해야 하고, 한정된 자원 내에서 더 강력한 모델 능력을 구현해야 한다는 것을 의미합니다. 이는 더 큰 모델로 확장하기 위해 필요한 기초 연구 중 하나입니다.
모델 구조 외에도, 우리는 데이터를 어떻게 구성할지, 모델을 어떻게 더 인간처럼 만들지 등 다양한 연구를 진행했고, 이는 우리가 출시한 모델에 반영되었습니다. 또한, Llama 구조는 훈련 효율성과 추론 비용 면에서 이미 해외 최고 수준과 두 세대 정도 차이가 납니다.
일반 인공지능이 목표…혁신 흐름에 참여해야
질문 : 이러한 세대 차이는 주로 어디에서 오는 것인가요?
량원펑 : 먼저 훈련 효율성에서 차이가 있습니다. 우리는 중국의 최고 수준과 해외의 최고 수준을 비교했을 때, 모델 구조와 훈련 역학에서 약 두 배의 차이가 있다고 추정합니다. 이 차이만으로도 우리는 동일한 효과를 내기 위해 두 배의 계산 자원을 소모해야 합니다.
또한 데이터 효율성에서도 두 배의 차이가 있을 수 있습니다. 즉, 우리는 동일한 효과를 내기 위해 두 배의 훈련 데이터와 계산 자원을 소모해야 합니다. 합치면 우리는 4배의 계산 자원을 더 소모해야 합니다. 우리가 해야 할 일은 이러한 격차를 줄이는 것입니다.
질문 : 대부분의 중국 회사들은 모델과 응용을 모두 추구하는 전략을 선택합니다. 왜 DeepSeek은 현재 연구와 탐구에만 집중하고 있나요?
량원펑 : 우리는 현재 가장 중요한 것이 세계적인 혁신의 흐름에 참여하는 것이라고 생각합니다. 지난 몇 년 동안, 중국 회사들은 다른 사람들이 기술 혁신을 하고, 우리는 그것을 가져와 응용으로 현금화하는 데 익숙해졌습니다. 하지만 이것은 당연한 것이 아닙니다. 이번 혁신의 물결에서 우리의 출발점은 기회를 틈타 돈을 버는 것이 아니라, 기술의 최전선에 서서 전체 생태계를 발전시키는 것입니다.
중국도 기술 혁신 할 수 있다
질문 : 인터넷과 모바일 인터넷 시대는 대부분의 사람들에게 미국이 기술 혁신에 능숙하고, 중국은 응용에 능숙하다는 관성을 남겼습니다.
량원펑 : 우리는 경제가 발전함에 따라 중국도 점차 기여자가 되어야 한다고 생각합니다. 지난 30년 동안 IT 혁명에서 우리는 진정한 기술 혁신에 참여하지 않았습니다. 우리는 무어의 법칙이 하늘에서 떨어지듯이, 집에서 18개월만 기다리면 더 나은 하드웨어와 소프트웨어가 나올 것이라고 생각하는 데 익숙해졌습니다.
스케일링 법칙(Scaling Law)도 마찬가지입니다. 하지만 사실, 이것은 서양이 주도하는 기술 커뮤니티가 세대를 거쳐 열심히 만들어낸 것입니다. 우리가 이 과정에 참여하지 않았기 때문에 그 존재를 간과했던 것입니다.
질문 : DeepSeek V2가 실리콘밸리의 많은 사람들을 놀라게 한 이유는 무엇인가요?
량원펑 : 미국에서는 매일 수많은 혁신이 일어납니다. 그들이 놀란 이유는 이번 혁신이 중국 회사에 의해 이루어졌기 때문입니다. 중국 회사가 혁신의 기여자로서 그들의 게임에 참여한 것입니다. 대부분의 중국 회사들은 따라가는 데 익숙하지, 혁신을 하는 데 익숙하지 않습니다.
자본이 아니라 인재
질문 : 하지만 이러한 선택은 중국의 맥락에서 너무 사치스럽게 보입니다. 대형 모델은 막대한 투자가 필요한 게임입니다. 모든 회사가 상업화를 고려하지 않고 연구와 혁신만 할 수 있는 자본을 가지고 있지는 않습니다.
량원펑 : 혁신의 비용은 분명히 높습니다. 과거의 가져다 쓰는 관성도 당시의 국정과 관련이 있습니다. 하지만 지금은 중국의 경제 규모나 바이트댄스, 텐센트 같은 대기업들의 이익을 보면, 전 세계적으로도 낮지 않습니다.
우리가 혁신에서 부족한 것은 자본이 아니라, 자신감과 고밀도의 인재를 조직화해 효과적인 혁신을 이루는 방법입니다.
지난 30년 동안, 우리는 돈을 버는 것만 강조했고, 혁신은 무시했습니다. 혁신은 완전히 상업적 동기에 의해 이루어지는 것이 아닙니다. 호기심과 창조 욕구도 필요합니다. 우리는 단지 과거의 관성에 묶여 있을 뿐입니다. 하지만 이것도 일시적인 현상입니다.
오픈소스는 문화…성취감 줄 수 있어
질문 : 하지만 당신들은 상업 조직이지, 공익 연구 기관이 아닙니다. 혁신을 선택하고, 오픈소스로 공유한다면, 어디에서 경쟁력을 확보할 건가요? 5월의 MLA 아키텍처 혁신도 다른 회사들이 금방 복사할 텐데요.
량원펑 : 혁신적인 기술 앞에서, 폐쇄적 시스템으로 형성된 경쟁력은 일시적입니다. OpenAI가 폐쇄적 시스템을 유지해도, 다른 사람들이 따라잡는 것을 막을 수 없습니다. 그래서 우리는 가치를 팀에 쌓아두고 있습니다. 우리의 동료들이 이 과정에서 성장하고, 많은 노하우를 쌓아 혁신할 수 있는 조직과 문화를 형성하는 것이 우리의 경쟁력입니다.
오픈소스와 논문 발표를 한다고 해서 우리가 무언가를 잃는 것은 아닙니다. 기술자들에게는 자신이 개발한 기술이 널리 활용되는 것이 큰 성취감이죠. 오픈소스는 사실상 문화적 행위이며, 단순한 비즈니스 전략이 아닙니다. 나눔은 오히려 추가적인 명예를 가져다줍니다. 이러한 문화는 회사 차원에서도 매력적인 요소가 됩니다.
인터뷰 3편으로 이어집니다.
같이 보면 좋은 기사