
네이버클라우드는 29일 글·이미지·음성 입력을 하나의 모델 안에서 분석하도록 설계된 '하이퍼클로바X SEED 8B 옴니'와 고성능 추론 모델인 '하이퍼클로바X SEED 32B 싱크(Think)'를 공개했다.
옴니멀티모달 모델은 텍스트·이미지·음성 등 서로 다른 입력을 하나의 모델이 통합적으로 이해하는 것이 특징인 최신 AI 모델이다. 기존 멀티모달 모델이 음성을 텍스트로 변환하는 등 단계별 처리를 거쳤다면, 옴니멀티모달은 단일 모델 구조에서 입력을 분석한다. 기존 멀티모달 AI가 여러 사람이 역할을 나눠 순차적으로 일을 처리하는 방식이라면, 옴니멀티모달은 한 사람이 여러 업무를 동시에 맡아 처리하는 구조에 가깝다. 입력을 여러 모델로 나누지 않고 하나의 모델에서 통합 처리하기 때문에, 응답 속도와 흐름이 단축돼 최종 처리 속도가 빠르다.
이 같은 구조는 실시간에 가까운 응답이 요구되는 서비스 환경에서 활용도가 높을 것으로 예상된다. 복수의 AI 모델을 순차적으로 호출하는 방식보다 연산 과정이 단순해지면서, 입력과 출력 사이의 지연을 줄일 수 있기 때문이다. 시각 정보와 음성 입력을 동시에 인식해야 하는 증강현실(AR)이나 자율주행, 사물인터넷(IoT), 산업 현장 등 다양한 환경에 적용될 수 있다.

고난이도 추론에 최적화된 'SEED 32B 싱크' 모델은 인간 수준의 문제 해결 능력을 증명했다. 네이버가 2025학년도 대학수학능력시험 문제지를 이미지 형태로 입력해 성능을 측정한 결과, 영어와 한국사 과목에서 만점을 기록했으며 전 과목에서 1등급 수준의 점수를 획득했다. 이는 별도의 텍스트 추출 없이 이미지 속 수식과 지문을 직접 해석해 도출한 결과다. 또한 글로벌 AI 평가 기관인 아티피셜 애널리시스의 벤치마크 지표에서도 글로벌 선도 모델들과 대등한 성능 범위를 기록하며 세계적인 경쟁력을 확인했다.
이번 공개 시점도 전략적이다. 네이버의 옴니멀티모달 AI 공개는 오는 30일 열리는 '독자 AI 파운데이션 모델 프로젝트' 1차 발표회를 하루 앞두고 이뤄졌다. 해당 프로젝트는 정부가 주도해 국내 AI 기술 경쟁력 강화를 목표로 추진 중인 사업으로, 글로벌 선도 AI 대비 95% 수준의 성능 확보를 목표로 제시해 왔다. 공개된 벤치마크 결과 역시 해외 유명모델에 근접했다는 점을 강조하는 데 초점을 맞춘 것으로 보인다.

서삼광 기자 (seosk@dailygame.co.kr)



