‘한국 특화’ 네이버 AI 모델, 영어도 유창…테크니컬 리포트 공개
네이버 초대규모 AI 모델 ‘하이퍼클로바X’…다국어 능력 ‘우수’
주요 모델과 성능 비교 진행…“우수한 소버린 AI의 모범 사례”
[이코노미스트 정두용 기자] 네이버는 ‘생성형 인공지능’(Generative AI) 시대에 대응해 ‘한국 특화’ 모델을 일찍이 공개한 바 있다. 네이버가 개발한 초대규모 AI 모델 ‘하이퍼클로바X’(HyperCLOVA X)가 한국어뿐 아니라 영어·일본어·아랍어·힌디어·베트남어 등에서도 높은 성능을 보인다는 연구 결과가 나왔다.
네이버클라우드는 ‘하이퍼클로바X’의 테크니컬 리포트를 3일 공개했다. 오픈AI·구글 등 빅테크는 자사 AI 모델의 특징을 ‘테크니컬 리포트’를 통해 소개하고 있다. 논문을 통해 학습 방법·성능 등 AI 모델의 세부 정보를 전달하는 식이다.
회사는 하이퍼클로바X와 14개 모델을 비교해 성능 평가를 진행했다. 하이퍼클로바X는 한국어·일반 상식·수학·코딩 부문에서 14개 모델 중 1위를 기록했다. 국가 언어 능력뿐만 아니라 보편 지식·프로그래밍 등 다양한 분야 문제 해결력을 갖췄단 의미다.
초대규모 AI 모델은 학습 데이터의 성질에 따라 그 성능이 결정된다. 하이퍼클로바X는 초기 챗GPT에 접목된 GPT-3.5 모델보다 한국어 데이터를 6500배 더 많이 학습했다. 네이버가 하이퍼클로바X를 ‘한국 특화’ 모델이라고 소개하는 까닭이다. 하이퍼클로바X와 폐쇄형(Closed-source)으로 개발된 4개 모델 비교에서 한국어 능력이 가장 우수하다고 나타난 이유다.
하이퍼클로바X는 그런데도 이번 평가에서 우수한 ‘다국어 능력’(Multilinguality)을 지닌 것으로 나타났다. 특히 영어 능력 분야에서 4개 비교 모델 중 2위에 올랐다. 하이퍼클로바X는 주요 오픈소스 모델을 포함한 9개 모델 중 일본어·아랍어·힌디어·베트남어를 비롯한 아시아 국가 언어 능력을 평가에서 가장 높은 점수를 획득했다. 중국어에서만 2위를 기록했다. 한국어와 영어 정보를 활용해 제3의 언어로 추론하는 능력을 지녔다는 점도 확인됐다.
기계 번역 평가에서도 하이퍼클로바X의 다국어 능력이 입증됐다. ▲한국어를 일본어로 ▲일본어를 한국어 ▲영어를 한국어로 번역하는 능력은 역시 10개의 모델 중 1위를 기록했다. 비교 대상에는 실제 서비스 중인 번역 모델이 포함됐다.
우수한 언어 능력, 어떻게 구현했나
네이버는 리포트를 통해 모델 학습 과정도 소개했다. 하이퍼클로바X의 사전학습(Pretraining) 데이터는 대부분 한국어·영어·코드 데이터로 구성된다. 회사 측은 “양질의 사전학습 데이터 구축을 위해 매우 짧거나 반복적인 저품질 문서는 자료 집합(데이터셋)에서 제외했다”며 “개인정보가 포함된 데이터도 삭제하고, 정렬학습(Alignment Learning)을 통해 사용자의 의도와 지시를 AI가 더 잘 이해할 수 있도록 모델을 고도화했다”고 밝혔다.
하이퍼클로바X의 안전성을 위한 노력도 리포트에 소개됐다. ▲사회적 이슈와 편향 ▲불법적 행동 등 민감하거나 위험한 주제를 설정해 ‘질의 데이터’를 수집했다. 이를 기반으로 레드티밍(Red-teaming)을 수행, 모델의 취약점을 보완하는 식으로 모델이 개발됐다. 레드티밍은 기술·서비스의 취약점을 발견하고 검증하기 위해 의도적으로 공격을 시도하는 활동을 말한다. 네이버 측은 “하이퍼클로바X 윤리 원칙에 기반해 혐오·편향·저작권 침해·개인정보 등의 콘텐츠는 생성하지 않도록 지속해서 개선하고 있다”고 전했다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술총괄은 “테크니컬 리포트를 통해 하이퍼클로바X의 성능 경쟁력이 다시 한번 입증됐다”며 “한국 특화 지식뿐만 아니라 프로그래밍·수학적 추론·다국어 능력·안전성을 확보한 소버린 AI의 모범 사례”라고 강조했다. 이어 “하이퍼클로바X 구축 경험을 활용해 향후 다양한 지역 및 국가의 특화 초대규모 AI를 만드는 데에도 적극적으로 나설 것”이라고 말했다.
하이퍼클로바X 테크니컬 리포트는 한국어·영어·수학·코딩·상식·사실성·안전성 등 각 분야의 성능 측정 평가가 담겨있다. 기준은 신뢰성 있는 평가 체계로 꼽히는 벤치마크(Benchmarks) 인용하거나 회사가 자체 개발한 지표가 활용됐다. 이를 통해 하이퍼클로바X 및 비교군 모델들의 성능 평가가 이뤄졌다.
테크니컬 리포트의 연구 부문을 이끈 유강민 네이버클라우드 리더는 “하이퍼클로바X의 다국어 추론,·기계 번역 능력을 측정한 실험은 지역 또는 문화권 특화 목적으로 개발한 AI가 해당 국가 언어 외에도 여러 언어에서 일정 수준 이상의 능력을 갖출 수 있음을 실증한 것”이라며 “특정 문화권에 더 적합한 배경지식과 함께 다국어 능력까지 보유해 한층 활용도가 높은 소버린 AI의 가능성을 하이퍼클로바X가 보여주고 있다”고 설명했다.
ⓒ이코노미스트(https://economist.co.kr) '내일을 위한 경제뉴스 이코노미스트' 무단 전재 및 재배포 금지
많이 본 뉴스
1‘검은 반도체’ 김 수출 역대 최고기록 달성…10억달러 수출 청신호
2이복현 "상법 개정보다 자본시장법 개정이 합리적"
3롯데, 해외 부실면세점 철수 검토…케미칼, 자산매각 추진
411월 기록적 폭설에 車사고 60% 급증…보험료 인상 조짐
5대한항공-아시아나 합병 4년만에 승인…통합 LCC도 출범
6이재명 “‘국장’ 떠나는 현실...PER 개선하면 ‘코스피 4000’ 무난”
7롯데바이오로직스 설립 2년 만 수장 교체…신임 대표는 아직
8상법 개정 되지 않는다면 “국장 탈출·내수 침체 악순환 반복될 것”
9열매컴퍼니, 미술품 최초 투자계약증권 합산발행