[블록미디어 안드레아 윤 에디터] 오픈AI가 24일 새로운 기능인 ‘오퍼레이터’를 공개했다. 이 디크립토에 따르면 이 기능은 ChatGPT가 가상 브라우저를 제어해 음식 주문이나 항공편 예약 같은 실생활 업무를 수행할 수 있게 한다. 하지만 현재 이 기능은 미국 내 프로 구독자(월 200달러)만 이용할 수 있다.
오퍼레이터는 오픈AI의 첫 번째 자율 웹 브라우징 기능으로, 구독자에 따라 기능의 접근성이 달라지는 계층적 금융 시스템을 부각한다. 프로 구독자는 고급 AI 기능에 접근할 수 있지만, 일반 구독자는 제한된 기능만 사용할 수 있다. 이는 민주적이지 않다는 지적이 있다.
사용자는 operator.chatgpt.com을 통해 다양한 온라인 업무를 ChatGPT에게 맡길 수 있다. 이전 시도들은 API를 활용해 어려움이 있었으나, 오퍼레이터는 클라우드 기반 브라우저를 통해 사람처럼 버튼을 누르고 폼을 작성한다. 모든 움직임은 스크린샷으로 기록된다.
오퍼레이터는 티켓 예약과 같은 작업을 수행하면서 시각적으로 진행 과정을 보여주고, 문제가 생기면 ‘상황 제어’ 버튼으로 사용자가 직접 제어할 수 있다. GPT-4o를 기반으로 한 컴퓨터 사용자 에이전트(CUA)라는 새로운 모델을 사용해 웹사이트 레이아웃을 이해하고 예기치 않은 팝업이나 오류도 처리한다.
오픈AI는 여러 기업과 협력해 플랫폼에서 원활하게 작동할 수 있도록 했으며, 지원되지 않는 웹사이트에서도 브라우저 제어 기능으로 작업을 시도한다. 오퍼레이터는 경쟁 모델들을 능가하며, OSWorld와 WebArena에서 높은 점수를 기록했다.
하지만 오퍼레이터는 연구 미리보기 상태라 오류나 버그가 있을 수 있으며, 사용자 자격증명을 요구해 보안에 민감한 사용자들이 신뢰하기 어려울 수 있다. 이 기능은 앞으로 플러스 구독자와 개발자를 대상으로 API를 통해 확장될 예정이다. 오픈AI는 클라우드 웹 브라우징 제어를 넘어 다양한 AI 에이전트를 개발 중이라고 밝혔다.
같이 보면 좋은 기사