두나무 머신러닝팀, BIRD-SQL 글로벌 리더보드 1위

[블록미디어 정아인 기자] 블록체인 및 핀테크 전문기업 두나무가 자사 머신러닝팀이 연구·개발한 텍스트-SQL 변환 모델이 글로벌 AI 모델 평가 지표인 BIRD-SQL에서 글로벌 리더보드 1위를 달성했다고 25일 밝혔다.

두나무 머신러닝팀은 주식과 디지털 자산 시장에서 활용되는 AI 모델을 연구·개발하고 있다. 현재 AI 모델링 및 튜닝, 모델 평가 매트릭 설정 등 다양한 데이터를 발굴해 두나무의 여러 서비스에 활용 중이다.

텍스트-SQL 변환 모델은 사람의 언어를 데이터 관리 프로그래밍 언어인 SQL로 변환하는 AI 모델로, 생성형 AI의 등장 이후 관심받고 있는 연구 분야다. 두나무 머신러닝팀이 이번에 개발한 텍스트-SQL 모델은 사용자가 자연어로 질문을 입력하면 SQL 변환이 필요한 데이터를 빠르고 정확하게 추출, 챗GPT의 성능을 강화한다.

AI 모델 성능 측정 벤치마크인 BIRD-SQL(A Big Bench for Large-Scale Database Grounded Text-to-SQLs)의 글로벌 리더보드에서 정확도 점수 65.4%, 효율성 점수 71.3%를 각각 받으며 모두 1위에 올랐다. GPT-4의 정확도(54.8%)와 효율성(60.7%)을 각각 10% 이상 상회하는 수치다.

2위 모델과도 정확도 항목에서 4.7%, 효율성에서 3.6%의 높은 성능 격차를 기록했다. 처음 1위에 오른 1월 14일 이후 현재까지도 계속 선두를 지키고 있다.

이번 연구를 통해 증권플러스에서 제공하는 인공지능 대화형 서비스 ‘우디’의 자연어를 통한 종목 스크리닝 성능을 크게 향상할 수 있을 것으로 기대된다.

이동준 두나무 머신러닝팀장은 “챗GPT로 촉발된 생성형 AI 기술 개발이 활발해지면서 두나무는 더 정교하게 자연어를 이해하고 누구나 쉽게 기술을 활용할 수 있도록 연구하고 있다”라며 “명령어에 따라 성능이 크게 달라지는 거대언어모델(LLM)의 한계점을 개선하는 데 초점을 맞춰 두나무의 다양한 서비스 향상에 이바지하도록 노력하겠다”라고 말했다.

속보는 블록미디어 텔레그램으로(클릭)

같이 보면 좋은 기사

그레이스케일이 꼽은 ‘AI 코인 4대 천왕’ …다보스 포럼, ‘인공지능+암호화폐’ 논의

중국 해커들, 텔레그램으로 범위 확대… 한국인 데이터 유출 순위 4위 – S2W

테슬라·아마존·메타 등 주가 급락… 트럼프 취임 후 시총 2,028조 원 감소

"약올리기, 철저한 거래와 변혁-트럼프의 세 모습"-WSJ

[주요 뉴스] SEC, 디파이 포함 ‘거래소’ 확대 재검토 지시…긍정적 신호

비트코인 페페, PEP-20으로 400만 달러 모금…이더리움 위협할까

코인 대통령 된다는 트럼프, ‘수혜주 미국 코인’ 뭐가 있을까? – 리플, 솔라나, 도지, 아발란체, 수이 등

[2025년 코인 돋보기] 디핀(DePIN), 탈중앙화 혁신으로 주목받는 인프라의 미래

[2025년 코인 돋보기] 비트코인, 상승세 이어질까… “올해 최대 21만달러 전망”

[2025년 코인 돋보기] 증시 수장들 “새해 디지털자산 ETF 승인·STO 허용 검토”

시장 1조 달러 증발 시킨 5가지 요인–비트코인닷컴

솔라나(SOL), ‘데드 크로스’ 임박… 하락 신호? 기회?

비트코인 선물 펀딩비 변동성 지속 … 시장 바닥 발견에 어려움

Pi 네트워크, 20% 하락 속 바이낸스 상장 기대… 3월 14일이 분수령?

[이드덴버 2025] 트랜체스 CGO “디파이, 지속 가능한 수익 모델과 전통 금융 연결이 핵심”

[이드덴버 2025] 스웻 이코노미 “운동도 자산인 시대… 블록체인으로 새 가치 창출”

[이드덴버 2025] API3 “블록체인 데이터 신뢰성 높인다… 오라클 기술 혁신 주도”

[이드덴버 2025] 모프 CEO “블록체인 기술, 실생활 접목으로 대중화 가속화 전망”

(주)블록미디어