[블록미디어 박현재] 디지털 시대에서 데이터는 ‘새로운 금’으로 불린다. 2024년 현재, 전 세계 평균 스크린 타임은 하루 6시간 40분이며, 미국에서는 7시간 3분에 달한다. 스크린 타임은 사용자가 앱과 웹사이트에서 소비하는 시간이다. 사람들의 온라인 활동이 증가함에 따라 생성되는 데이터의 양도 급격히 늘고 있다. 매일 약 328.77만 테라바이트(TB), 즉 0.4 제타바이트(ZB)의 데이터가 생산되지만, 정작 사용자가 이를 소유하는 경우는 거의 없다.
소셜미디어, 사물인터넷(IoT) 기기, 헬스케어 앱 등 다양한 플랫폼에서 생산되는 데이터는 플랫폼 기업이나 서비스 제공업체가 관리한다. 예를 들어, 트위터나 인스타그램에서 사용자가 올린 게시물은 플랫폼의 소유이며, 스마트 기기에서 발생하는 데이터 역시 제조사나 서비스 제공업체가 통제한다. 건강 앱과 웨어러블 기기를 통해 수집된 의료 데이터 또한 기업이 보유하고 있으며, 사용자가 이를 자유롭게 활용하거나 수익화하는 것은 쉽지 않다.
AI 기술이 빠르게 발전하면서 데이터의 가치는 더욱 중요해지고 있다. 그러나 데이터를 생산하는 사용자가 소유권을 갖지 못하는 구조는 여전히 변하지 않고 있다. 크립토 전문가 0xjeff에 따르면 이에 대한 대안으로 웹3 기반 데이터 레이어가 등장하고 있으며, 이는 사용자에게 데이터 소유권을 돌려주고 이를 직접 활용하거나 수익화할 수 있도록 돕는 탈중앙화 인프라를 구축하는 데 초점을 맞추고 있다고 한다.
# 웹3 데이터 레이어의 등장: 사용자 중심 데이터 경제 구축
웹3에서는 개인이 자신의 데이터를 직접 소유하고, 이를 수익화할 수 있는 다양한 프로젝트가 등장하고 있다. 대표적인 사례로 바나, 오션프로토콜, 마사, 오픈렛져가 있다. 이들은 각기 다른 방식으로 데이터 소유권을 사용자에게 돌려주고, AI 및 기타 데이터 활용 시장에서 새로운 경제 모델을 창출하고 있다.
– 바나(VANA): DataDAO를 통한 사용자 데이터 소유권 확대
바나는 AI 모델 훈련 데이터에서 개인이 데이터 소유권을 가질 수 있도록 지원하는 프로젝트다. 핵심 개념은 DataDAO(데이터DAO)로, 사용자가 특정 데이터 그룹을 공동으로 관리하고 이를 기반으로 보상을 받을 수 있도록 설계됐다.
r/datadao: 레딧(Reddit) 사용자 데이터를 기반으로 한 DAO로, 사용자들이 레딧에서 생성한 데이터를 직접 통제하고 수익화할 수 있도록 한다.
Volara: 트위터 데이터를 다루는 DAO로, 트위터에서 생성된 콘텐츠를 활용하여 사용자가 보상을 받을 수 있도록 지원한다.
DNA DAO: 유전자 데이터 관리를 위한 DAO로, 개인이 자신의 유전자 데이터를 통제하고 연구 및 기타 용도로 활용할 수 있도록 한다.
바나는 데이터 소유권을 사용자에게 돌려주는 것뿐만 아니라, 데이터를 토큰화하여 거래할 수 있도록 한다. 바나의 생태계에서는 DLP(Data Liquidity Pools)라는 개념을 통해 데이터를 유동성 자산처럼 운영하며, 사용자들은 특정 데이터 풀에 기여하고 보상을 받을 수 있다. 이 같은 모델은 기존의 중앙화된 데이터 관리 방식과 차별화되며, 사용자가 데이터의 가치를 직접 실현할 수 있도록 한다.
– 오션프로토콜(Ocean Protocol): 분산형 데이터 마켓플레이스
오션프로토콜은 데이터 제공자가 데이터를 공유, 판매, 라이선스할 수 있도록 지원하는 탈중앙화 데이터 마켓플레이스다. Ocean은 데이터 경제를 보다 개방적인 구조로 만들기 위해 **데이터토큰(Datatoken, ERC-20)**을 활용해 데이터 접근 권한을 거래할 수 있도록 한다.
오션프로토콜에서 거래되는 데이터 유형은 크게 두 가지로 나뉜다.
공공 데이터: 기상 정보, 공공 인구 통계, 역사적 주식 데이터 등으로, AI 훈련 및 연구 목적으로 활용된다.
개인 데이터: 의료 기록, 금융 거래 데이터, IoT 센서 데이터 등 민감한 정보로, 강력한 프라이버시 보호 기능이 필요하다.
특히 Compute-to-Data 기능을 통해 데이터 제공자가 데이터를 직접 공유하지 않고도 AI 모델이 이를 분석할 수 있도록 한다. 이를 통해 데이터 프라이버시를 보호하면서도 AI 훈련 데이터 수요를 충족할 수 있다.
– 마사(MASA): AI 훈련을 위한 실시간 데이터 공급
마사는 AI 모델 훈련을 위한 실시간, 고품질 데이터를 공급하는 프로젝트다. 마사는 비트텐서(TAO) 네트워크에서 운영되는 두 개의 서브넷(SN42, SN59)을 통해 AI 데이터 시장을 구축하고 있다.
Subnet 42 (SN42): 매일 수백만 개의 데이터 기록을 처리하여 AI 모델이 보다 정확한 예측을 할 수 있도록 지원한다.
Subnet 59 (SN59, AI Agent Arena): AI 에이전트들이 실시간 데이터를 활용해 경쟁하며 보상을 받는 환경을 조성한다.
마사는 AI 에이전트가 자율적으로 데이터를 수집하고 활용할 수 있도록 하여, AI 기반 경제 모델의 발전을 가속화하고 있다.
오픈렛져(Open ledger): AI 및 머신러닝을 위한 블록체인 인프라
오픈렛져는 데이터 검증 및 AI 훈련을 위한 블록체인 네트워크를 구축하고 있다.
Datanets: AI 애플리케이션을 위한 데이터 소싱 네트워크를 제공하며, 고품질 데이터를 AI 모델이 쉽게 활용할 수 있도록 한다.
SLMs (Specialized Language Models): 특정 산업 및 응용 분야에 맞춘 AI 모델을 개발하여 보다 높은 정확도를 보장한다. 데이터 검증 시스템을 통해 AI 모델 훈련 데이터를 검증하고 신뢰성을 확보하는 역할을 한다.
아이겐레이어(EigenLayer)와 협력하여 온체인 데이터 기여자의 보상 모델을 개발하는 등 AI와 블록체인을 접목한 데이터 경제 모델을 확장하고 있다.
AI와 자율 에이전트의 발전으로 인해 고품질 데이터에 대한 수요는 계속 증가하고 있다. 그러나 기존 데이터 시장은 중앙화된 플랫폼이 주도하는 구조를 벗어나지 못했다. 웹3 데이터 레이어 프로젝트들은 이러한 한계를 극복하고, 데이터 소유권을 사용자에게 돌려주기 위한 솔루션을 제시하고 있다.
웹3 데이터 레이어가 본격적으로 자리 잡으면, 사용자들은 자신이 생산하는 데이터를 보다 직접적으로 통제하고 수익화할 수 있게 될 것이다. 데이터는 더 이상 플랫폼 기업의 자산이 아니라, 사용자가 직접 관리하는 디지털 경제의 핵심 요소로 자리 잡게 될 전망이다.
같이 보면 좋은 기사