일론 머스크가 자신의 AI 챗봇 Grok의 차세대 버전인 Grok-3의 출시가 몇 주 남지 않았다고 밝혔다. 머스크는 이를 “무서울 정도로 스마트”하다고 표현하며, 테스트에서 모든 다른 AI 모델을 이미 능가했다고 주장했다.
xAI CEO인 머스크는 13일(현지시각) 두바이에서 열린 세계 정부 정상회의에서 이러한 발언을 했다. 그는 “때때로 Grok-3는 무서울 정도로 스마트하다. 예상치 못한 솔루션을 찾는다”고 말했다.
Grok-3 개발자들은 독특한 훈련 방법을 사용했다. 실제 데이터를 사용하는 대신 합성 데이터를 활용하고, 논리적 일관성을 유지하기 위한 자기 교정 메커니즘을 도입했다. 머스크는 Grok-3가 잘못된 정보를 만났을 때 시스템이 데이터를 반영하고 현실에 맞지 않는 내용을 제거하는 방식으로 정확성을 높였다고 주장했다.
Grok-3 훈련에는 막대한 컴퓨팅 자원이 필요했다. 전문가들은 2억 GPU 시간이 소요됐다고 추산했으며, 이는 중국의 경쟁자인 DeepSeek-V3의 270만 시간을 능가하는 수치다. Grok-3는 xAI의 Colossus 슈퍼클러스터에서 10만 개의 Nvidia H100 GPU를 사용했으며, 이는 이전 모델의 10배 더 많은 컴퓨팅 파워다. 머스크는 세부 조정 없이도 기본 모델이 Grok-2보다 우수하다고 주장했다.
Grok-3는 머스크의 소셜 미디어 플랫폼 X와의 통합으로 실시간 데이터를 수집할 수 있는 이점이 있다. 시스템은 실시간 데이터를 X에서 직접 가져올 수 있으며, “Unhinged Mode”라는 모드를 특징으로 한다. 이는 xAI의 FAQ에 따르면 “불쾌하고 부적절하며 공격적”인 것으로 의도된 모드다.
그러나 시스템은 아직 완벽하지 않다. 머스크는 남은 작업을 “집을 완성하는 것과 같다”며 “마지막 5%는 벽을 치고 페인트를 하고 마무리하는 과정이지만, 그 작업이 집을 변화시킨다”고 비교했다.
Grok-3는 OpenAI의 GPT-4.5보다 일찍 출시될 가능성이 있다. 엘론 머스크는 “아마도 (Grok-3는) 약 일주일이나 이주일 후에 출시 될 것이다”고 말했다. 새로운 버전이 공개적으로 이용 가능한지 아니면 구독 요금제 뒤에 숨겨질지는 밝히지 않았다.
AI 시장의 경쟁이 치열해졌다. 2024년 ChatGPT가 시장 점유율을 지배했지만, 중국의 오픈 소스 모델 DeepSeek-V3가 적은 자원을 사용하면서도 GPT-4o와 Meta의 Llama 3.1을 능가하며 유력한 경쟁자로 등장했다.
처음 Grok은 X 프리미엄을 통해 제한적으로 제공됐다. 이후 머스크의 소셜 미디어 플랫폼 모든 사용자에게 무료로 제공됐으며, 현재는 모든 사용자를 위한 독립적인 웹 사이트도 운영 중이다.
xAI, 추론 AI 전쟁에 가세
주요 AI 기업들은 특정 문제를 반영하고 긴 사슬의 추론 끝에 해결책을 찾는 추론 모델 개발에 집중하고 있다. 이 아이디어는 Matt Schumer가 Reflection 70b를 발표했을 때 처음 explored됐으나, 공모된 타의 모델인 Claude 3.5 Sonnet을 능가하지 못했다.
몇 주 후, OpenAI는 “OpenAI o1” 추론 모델을 발표하여 동일한 개념을 효과적으로 적용했다. 이 모델은 AI 모델이 나타낼 수 있는 논리적 능력의 새로운 표준을 세웠으며, OpenAI가 AI 산업을 지배할 수 있는 방책으로 보였다.
그러나 DeepSeek의 출시는 모든 것을 뒤집어 놓았다. 중국의 연구팀은 o1보다 낮은 비용으로 더 나은 모델을 제작하였고, 이를 오픈 소스로 만들었다. 그 이후로 OpenAI는 미래 모델을 모든 일을 할 수 있는 AI로 합쳐 전통적인 GPT 구조에서 탈피하고 깊은 추론에 중점을 둔 모델을 개발할 것이라고 발표했다.
xAI도 시장을 따르는 것으로 보인다. 머스크는 “Grok-3는 매우 강력한 추론 능력을 가지고 있다”고 말했다. 모델의 구조에 대해서는 추가 정보를 공개하지 않았다. Grok-2의 현재 버전은 LLM Arena에서 18위를 차지하고 있으며, GPT, Claude, Gemini, Qwen 또는 DeepSeek과 같은 경쟁자보다 아래에 있다.
xAI는 향후 모델을 위한 컴퓨팅 인프라를 100만 GPU로 확장할 계획이다. 머스크에 따르면 궁극적인 목표는 인공 일반 지능을 향해 나아가는 점점 더 정교한 모델을 개발하는 것이다.
같이 보면 좋은 기사