[블록미디어 박현재] 최근 AI 열풍은 세계 곳곳에서 식을 줄 모르는 상황이다. 그것은 블록체인 업계에서도 마찬가지인데, 블록체인과 AI는 얼핏 아무 연관도 없어 보인다. 그럼에도 블록체인 특성을 활용하여 AI 사업과 결합한 프로젝트들이 많이 나온다. 과연 AI와 블록체인 두 분야는 아무런 연관성이 없을까?
답은 그렇지 않다. AI 영역을 넓히면 그 중에 연합학습(Federated Learning)이라는 것이 있다. AI는 넓은 의미로 봤을 때 머신러닝의 한 종류라고 할 수 있다. 머신러닝의 종류는 강화학습부터 우리가 잘 알고 있는 GPT의 대규모 자연어 처리 모델(LLM)까지 다양하게 존재한다. 연합학습도 이 머신러닝의 한 종류다. 연합학습은 분산된 네트워크와 기기에서 각각의 다른 데이터를 기반으로 동일한 모델을 학습하고 중앙으로 모아 하나의 모델을 고도화시키는 방식이다.
쉬운 예로 스마트폰의 키보드 자동완성 기능을 생각할 수 있다. 우리가 타이핑을 하면서 자주 사용하는 단어나 오타, 문맥에 따른 단어 사용 패턴은 각자의 스마트폰에서 학습된다. 그런데 이 학습에 사용되는 개인적인 대화 내용(즉, 데이터)는 중앙 서버로 직접 전송되지 않고, 사용자가 ‘ㄱ’을 쓸 때 ‘ㅋ’을 쓰는 오타가 자주 난다는 정보만 전송된다.
이처럼 학습된 자동완성 모델의 가중치만이 중앙 서버로 전송되고, 여러 사용자들의 학습 모델의 가중치를 기반으로 새로 모델을 개선한다. 그 후 이 모델이 다시 각 기기로 배포되어 더 나은 자동완성 기능을 제공하는 원리다. 이러한 연합학습의 방식은 데이터를 중앙에서 수집하지 않고도 모델을 개선할 수 있다.
하지만 최근 발생한 여러 인공지능(AI)의 거버넌스 논란, 딥페이크, 오픈AI 이사회 사태, AI의 데이터 편향성 문제, Stability AI를 상대로 한 게티이미지(Getty Images) 소송 등은 기존 인공지능 개발 구조의 한계를 드러내기도 한다.
현재 AI 혁신에 있어 가장 큰 장벽은 중앙집권화 문제다. 현재의 상황에서는 세계 최대 기업들이 AI 개발 방향을 주도하고 있다. 그러나 이들이 추구하는 목표는 반드시 공공의 이익과 일치하지 않는다.
특히 대형 기업들이 AI를 통제하게 되면, 그들의 편향된 가치와 시각이 전 세계적으로 확대된다. 이들은 AI 모델 접근 권한을 독점적으로 관리하며, 그들의 가치관에 맞춰 AI 성능이 저하되기도 한다. 그 결과로 △대중의 참여 부족 △계산 능력 접근성 저하 △편향된 데이터와 낮은 품질의 훈련 데이터 사용으로 인한 오류가 발생하며, AI의 선한 영향력을 최대한 발휘하지 못하는 상황이 이어지고 있다.
따라서 더 많은 이들이 AI 개발 과정에 참여하고, 이 모델 개선에 기여한 이들에게 공정한 보상을 제공하는 시스템이 절실히 필요하다. 플록(FLock)은 이러한 문제를 블록체인 기술을 활용해 해결할 수 있다고 판단했다.
플록은 블록체인 보상 체계를 플랫폼에 적용하여 AI 모델의 개발과 데이터 사용, 학습 등을 탈중앙화 방식으로 이뤄질 수 있도록 설계된 서비스다. 특히 최근 AI 분야에서 문제시되는 데이터 소유권의 중앙집중화를 플랫폼과 블록체인의 토크노믹스를 활용하여 해결하려 한다. 소수의 기업에 의해 AI 모델들이 개발, 배포되는 상황에서 수없이 많은 개인들의 정보가 자유롭게 이용되고 있다.
신산업의 특성상 개발에만 집중하다보니 저작권과 소유권 문제는 부차적으로 여겨졌었고, 단일 기업의 불투명하고 편향된 운영에 고스란히 노출될 수 있다. 연합학습은 상기 언급한 바와 같이 개인 데이터는 보호된 상태에서 모델 학습이 진행되기 때문에 개인정보보호와 투명성, 신뢰성을 가진다.
플록의 서비스는 크게 세 가지로 구성되어 있다. AI 아레나, FL(Federated Learning) 얼라이언스, 그리고 AI 마켓플레이스다. 하나의 모델이 탄생하기까지 아래 나열한 순서대로 워크플로우가 진행된다.
1. AI 아레나
AI 아레나는 학습하고 싶은 모델이 생성되고 선정되는 장소다. 이 아레나는 학습 생성자(Task Creator), 데이터 제공자(Data Provider), 트레이닝 노드(Training Node), 검증자(Validator), 위임자(Delegator)로 구성된다.학습 생성자를 통해서 생성된 과제는 검증된 AI 개발자를 통해서 연합학습이 아닌 전통적인 방식으로 모델의 학습이 이뤄진다. 이 때 각 학습자의 개인 로컬 장치에서 모델 학습이 수행되고, 각 학습자는 자신의 데이터나 공개된 데이터를 이용해 모델 최적화를 진행한다.
플록 커뮤니티에서 특정한 작업 요청이 들어오면 학습자는 해당 작업에 적합한 기초 모델을 선택하고 추가적인 학습과 머신러닝을 진행한다. 이 중 가장 성능이 뛰어나고 최적화된 기초 모델은 FL 얼라이언스로 올라간다.
AI 작업을 처리하는 훈련 노드는 작업 생성자가 요청한 작업을 훈련하고, 미세 조정하는 역할을 담당한다. 이 메커니즘은 노드들이 스테이킹을 통해 이해관계를 가지게 함으로써 생태계의 무결성과 건강성을 보장한다. 훈련 노드들은 기여도에 따라 보상을 받는다. 훈련 노드가 되기 위해서는 사용자가 등록비를 지불하고 $FML을 스테이킹해야 한다.
각 작업마다 훈련 노드에 대한 보상은 두 가지로 나뉜다. 하나는 매일 지급되는 ‘보상 A’이고, 다른 하나는 작업이 완료될 때 지급되는 ‘보상 B’다.
검증자는 훈련 노드가 제출한 작업을 평가하는 역할을 맡고 있다. 검증자도 평가 작업을 시작하기 전에 스테이킹을 해야 하며, 작업이 완료되면 보상을 받을 수 있다. 이는 FLock 네트워크의 품질과 신뢰성을 유지하는 데 필수적인 요소다.
2. FL 얼라이언스
FL 얼라이언스는 연합학습을 활용하여 AI 아레나에서 학습된 기초 모델을 더욱 발전시키는 연합학습 플랫폼이다. FL 얼라이언스는 데이터 주권을 보장하면서, 여러 참여자들이 로컬 데이터를 기반으로 글로벌 모델을 연합학습 하에 학습할 수 있도록 돕는다.이 과정에서 로컬 데이터를 중앙에 전송하지 않으며, 각 로컬 장치에서 학습된 모델의 가중치만이 집계되어 최적의 글로벌 모델을 형성할 수 있다. 이를 통해 데이터 프라이버시를 보호하면서도 모델 성능을 향상시킬 수 있다.
3. AI 마켓플레이스
AI 마켓플레이스는 AI 아레나와 FL 얼라이언스를 통해 학습된 모델이 공개되고 활용되는 플랫폼이다. 여기서 최종적으로 학습된 모델은 사용자들이 사용할 수 있도록 배포되며, 데이터 제공자와 컴퓨팅 자원 제공자는 자신의 기여에 따라 수익을 얻게 된다.모델 소유자는 사용자들의 데이터 기여를 재활용하여 모델을 지속적으로 미세 조정할 수 있으며, 이를 통해 훈련과 미세 조정 과정이 지속적으로 개선된다.
이 플록 서비스 과정의 주요 참가자는 △작업 생성자 △훈련 노드 △검증자 셋이다. 작업 생성자는 쉽게 말해 만들고자 하는 모델을 정하는 사람이다. 작업 생성자는 네트워크에 충분한 자산을 스테이킹했거나 시스템에 기여한 인원들이 선발된다. 이렇게 다양한 구성원에게 소유권 분배와 참여 기회를 제공하고 참여를 통해 다양성을 얻을 수 있다.
학습 노드는 AI 작업을 학습시키는 과정에서 서로 경쟁하는 주체다. 작업 생성자가 생성한 모델을 학습시키기 위해서는 토큰을 필수적으로 스테이킹해야한다. 학습 노드는 안정성과 보안성을 위해서 네트워크의 무결성을 유지해야한다. 스테이킹을 통해서 학습 노드가 높은 성과를 낼 수 있도록 지속적으로 유도하는 메커니즘이다.
검증자는 학습 노드가 수행한 작업을 평가하고 각 노드 별 결과물에 대한 점수를 매기고 제출한다. 마찬가지로 검증자가 되기 위해서는 토큰을 스테이킹해야하고, 스테이킹 양에 비례하여 작업이 공정하게 배분된다. 작업이 완료될 시 검증자는 토큰을 언스테이킹하고 작업에 대한 보상을 청구한다. 이를 통해 정확하고 정직한 검증을 진행할 수 있도록 인센티브를 부여한다.
모델 훈련과 평가 과정에서 참여자들은 정직한 참여와 정확한 기여를 통해 보상을 받는다. 참여자들의 투표가 다수의 결정과 일치할 경우 보상이 주어지며, 다수의 지지를 받은 업데이트를 제안한 제안자 또한 보상을 받는다.
한편, 참여자들은 투표가 다수 의견과 일치하지 않을 경우 스테이킹한 토큰의 일부를 잃는 페널티(슬래시, Slash)를 받는다. 이는 악의적인 행동을 억제하고 모델의 무결성을 유지하는 데 기여한다.
플록은 2024년 5월에 테스트넷을 출시한 이후 얼마 되지않아 생태계 내 참여가 매우 활발해졌다. 2024년 9월 기준으로, 플록의 네트워크 상에 1400명의 AI 엔지니어가 참여하고 있으며, 이들이 제출한 AI 모델만 1만 5천 개가 넘는다. 또한, 160만 건 이상의 모델 검증이 이루어졌으며, 이를 통해 37개의 AI 모델이 표준 모델로 선정됐다. 이 모델들은 AI 보조, 거래 에이전트, 건강 모니터링 등 다양한 응용 프로그램에서 사용된다.
이러한 성과는 플록의 기술적 우수성과 블록체인과 연합학습을 결합한 혁신적인 접근 방식 덕분에 가능했다. 플록의 모델은 악성 노드가 40%일 때도 95.5%의 정확도를 유지하며, 이는 기존 중앙화된 연합학습 시스템보다 훨씬 높은 보안성과 성능을 제공한다.
또한, 플록은 이더리움 재단의 2024년 학술 보조금을 수상하며 그 기술력을 인정받았다. 플록은 이더리움 재단으로부터 보조금을 수령한 유일한 인공지능 프로젝트이기도 하다.
플록은 중앙화된 AI 시스템의 문제점을 해결하고, 탈중앙화된 AI 학습 시스템을 통해 AI 개발을 민주화하는 데 중요한 역할을 하고 있다. 연합학습과 블록체인을 결합하여 데이터 주권을 보장하면서도 AI 모델을 효율적으로 학습시킬 수 있으며, 이는 AI의 투명성과 보안성을 향상시키는 데 큰 기여를 할 것이다.
어떻게 보면 복잡하다고 느낄 수 있는 플록의 구조는 블록체인 플랫폼이 안정적으로 운영되기 위해 필수적으로 정밀하게 설계된 구조다. AI의 분야 속에서 블록체인과 가장 접목가능성이 높은 연합학습을 바탕으로 한 만큼 향후 테스트넷이 끝나고 메인넷이 가동됐을 때 그 활성화 정도가 이어나가질 수 있을지 지켜봐야할 프로젝트다.
지속적으로 다양한 프로젝트가 출시되면서 적절한 비즈니스 모델과 플랫폼 구조를 찾는 와중에 플록의 도전이 유의미한 결과를 낳아 블록체인과 AI 양측 분야에서 기준점이 될 수 있을지 기대된다.
같이 보면 좋은 기사