[블록미디어 박현재] 인공지능(AI) 기술이 발달하며 그 학습에 사용되는 개인 데이터 소유권은 점차 그 중요성이 높아지고 있다. 바나(VANA)는 데이터 소유권과 AI 학습의 결합을 통해 블록체인 생태계에 새로운 변화를 제시하고 있는 프로젝트다.
기존의 AI 모델이 대형 기업의 데이터와 자원을 독점적으로 사용하는 것과 달리, 바나는 개인이 자신의 데이터를 통해 AI 모델을 훈련하고 보상을 받을 수 있는 혁신적인 방식을 제안하고 있다.
블록미디어는 이번 KBW 행사에서 바나의 안나 카즐라우스카스(Anna Kazlauskas)와 만나 탈중앙화된 AI 생태계 구축의 비전과 데이터 DAO의 가능성에 대해 이야기를 나눴다.
바나가 데이터 소유권을 기반으로 사용자 주도의 AI 모델을 어떻게 실현하고자 하는지, 그리고 이를 통해 향후 블록체인과 AI 산업이 어떻게 변화할 수 있는지에 대한 구체적인 전략을 들어봤다.
Q. 바나를 창립하게 된 계기와 소개를 부탁한다.
A. 2015년에 암호화폐에 처음 관심을 가지게 됐다. 이더리움을 MIT 기숙사 방에서 무료 전기를 사용해 채굴하면서 암호화폐의 탈중앙화 가능성을 경험했다. 이후 MIT AI 연구소에서 AI 연구를 진행하면서 데이터의 중요성을 깨달았고, 이를 바탕으로 바나를 시작하게 됐다.
바나는 암호화폐의 탈중앙화 개념을 데이터와 AI에 적용해 개인이 자신의 데이터를 소유하고, 이를 통해 AI 모델을 훈련시킬 수 있는 시스템을 제공하는 것이 목표다.
Q. 바나의 핵심 개념은 데이터 소유권인데, 구체적으로 어떤 것인가?
A. 웹2 플랫폼에서는 사용자들이 애플리케이션을 사용할 때 데이터가 애플리케이션 안에 남아서 플랫폼이 소유하게 된다. 하지만 법적으로는 사용자가 데이터를 소유하는 것으로 되어있다.
바나는 사용자들이 데이터를 플랫폼에서 가져와 자신의 지갑에 연결하고 통제할 수 있도록 하는 비수탁형 데이터 관리 방식을 채택했다. 이를 통해 사용자가 자신의 데이터를 통해 AI 모델을 학습시키고, 그 모델의 소유권까지 가질 수 있도록 하는 것이 목표다.
Q. 바나가 AI와 블록체인을 연결해 어떤 혁신을 기대하나?
A. 기존 AI는 본질적으로 매우 중앙화된 기술이다. 막대한 컴퓨팅 자원과 방대한 데이터가 필요하기 때문이다. 그러나 빅테크 기업이 AI 모델에게 학습시킬 수 있는 것은 오로지 대중에게 공개된 데이터 뿐이다.
그러한 데이터는 이미 다 학습에 사용되어 부족해지고 있는 상황이고 전문가들은 이를 가리켜 ‘데이터 월(Data wall)’이라 말한다. 하지만 바나는 블록체인을 통해 더 분산된 소유권을 제공하고, 여러 사람들이 데이터를 모아 AI 모델을 만들 수 있도록 한다.
따라서 대중에 공개되지 않은 개인 데이터를 학습에 사용할 수 있기 때문에 중앙화된 AI보다 더 나은 성능의 AI 모델을 사용자들과 함께 만들어 나갈 수 있다. 이는 단순한 데이터 소유권을 넘어서, 개인이 데이터 DAO에 참여해 공동으로 AI를 개발하고 소유하는 혁신적인 구조를 제안한다.
Q. 데이터 소유권을 강조했는데, 바나 네트워크에서 그 소유권을 어떻게 확인할 수 있나?
A. 바나는 MIT의 팀 버너스 리가 개발한 솔리드 프로젝트(Solid Project)의 기술을 활용해 개인이 데이터를 자신의 서버에 저장하고 필요할 때만 AI 모델 훈련에 사용할 수 있도록 하고 있다.
이렇게 사용자가 자신의 스토리지에서 데이터를 직접 통제할 수 있는 시스템을 구축했다. 또, 데이터 다오(DAO)에 기여하면 해당 데이터로 만들어진 AI 모델의 소유권을 가지게 된다.
Q. 현재 진행 중인 바나의 프로젝트가 있나?
A. 현재 레딧 데이터 다오가 테스트넷에서 운영되고 있다. 14만 명의 레딧 사용자가 자신의 데이터를 모아 데이터 풀을 구성하고 AI 모델을 학습시키는 과정이 진행 중이다.
이렇게 모은 데이터로 학습된 AI 모델은 재치 있거나 유머 감각을 보여 기존 중앙화된 모델에 없었던 것이다. 또한, 링크드인 데이터 다오, 패션 데이터 다오 등 다양한 프로젝트가 초기 단계에 있다.
Q. 데이터의 수요와 공급은 어떻게 이루어지나?
A. 데이터의 공급은 무한에 가까운 것은 이견이 없다. 그러나 수요에 대해서는 다들 의문을 표한다. 올해 초, 레딧 유저의 데이터가 200만 달러에 판매된 적이 있다. 이처럼 유저 데이터의 가치는 상당히 높지만, 대부분의 수익은 기업이 가져가기 때문에 일반인들은 그 수요를 인식하지 못한다.
바나는 이를 사용자들에게 되돌려 주는 시스템을 구축하려고 한다. 레딧 데이터 다오는 이미 첫 데이터 구매자를 확보했고, 패션 회사들이 트렌드 예측을 위해 데이터를 구매하려는 움직임을 보이고 있다.
Q. 바나의 토크노믹스 구조는 어떻게 되어 있나?
A. 바나의 토크노믹스는 이더리움과 유사한 디플레이션 구조를 가지고 있으며, 네트워크 내 모든 거래에서 소량의 데이터 거래 수수료를 지불하게 된다. 또한, 각 데이터셋마다 고유의 토큰을 가진다.
레딧 데이터 셋은 레딧 데이터 토큰을 가지는 식이다. 각 데이터 셋의 토큰 가치를 평가해서 우리는 간접적으로 특정 데이터가 가지는 가치를 평가할 수 있다. 예를 들어 링크드인 데이터셋 전용 토큰, 트위터 데이터셋 전용 토큰이 있고 각 토큰의 가격이 다르며 유저들은 데이터에 기여한 만큼 보상을 받게 된다.
Q. 탈중앙화된 AI와 블록체인이 중요한 이유는 무엇인가?
A. 데이터와 AI 기술은 대규모 중앙화된 기업들이 주도하고 있다. 하지만 개인이 데이터 소유권을 되찾고 이를 통해 AI 모델을 만드는 것이 중요한 이유는 사용자가 자신이 만든 AI 모델을 소유하고 통제할 수 있다는 점이다.
소유권을 가지지 못하면 AI 시대가 자신의 일자리를 대체할 것이라는 두려움을 느껴야 한다. 그러나 탈중앙화 방식을 통해 데이터와 AI 모델에 대해 소유권을 가지게 되면 AI가 나를 대신해 경제적 활동을 이어나가는 것으로 이해할 수 있다. 그러니 AI에 탈중앙화와 소유권 확립은 필수적이라 볼 수 있다.
Q. 앞으로 바나의 계획은 어떻게 되나?
A. 현재는 테스트넷 단계이며, 올해 말 메인넷 출시를 준비하고 있다. 다양한 데이터 다오와 협력해 탈중앙화된 AI 생태계를 구축할 계획이다. 앞으로 바나가 AI와 블록체인을 결합해 어떤 혁신을 이끌어낼지 기대해달라.
같이 보면 좋은 기사