IT 일반

LG ‘AI 기술력’ 누구나 누린다…‘엑사원 3.0’ 오픈소스 공개

정두용 기자

입력 2024.08.07 17:02 수정 2024.08.07 17:12

공유: 공유

인쇄: 인쇄

URL: URL복사

댓글: 댓글

활용도 높은 ‘경량 모델’ 오픈소스 제공…“AI 연구 생태계 발전 기여”
연내 학습 데이터 1억건 확장…엑사원 적용 제품·서비스 출시 확대

배경훈 LG AI연구원장이 2023년 7월 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 LG AI 토크 콘서트에서 생성형 AI ‘엑사원 2.0’(EXAONE 2.0)의 주요 기능을 발표하고 있다. LG AI연구원은 이를 더 발전시켜 2024년 8월 7일 ‘엑사원 3.0’을 공개했다. [사진 ㈜LG]

[이코노미스트 정두용 기자] LG의 인공지능(AI) 기술력을 ‘누구나’ 사용할 수 있게 됐다.

LG AI연구원은 최신 AI 모델 ‘엑사원(EXAONE) 3.0’을 오픈소스로 공개했다고 7일 밝혔다. LG AI연구원 측은 “AI 연구 생태계 발전에 기여하기 위해 ‘엑사원 3.0’ 모델 중 성능과 경제성에 있어 가장 활용도가 높은 ‘경량 모델’을 연구 목적으로 활용할 수 있도록 오픈소스를 공개한다”고 전했다.

LG AI연구원은 또 임직원을 대상으로 ‘엑사원 3.0’을 기반으로 만든 생성형 AI 서비스인 ‘챗엑사원’(ChatEXAONE) 베타 버전을 공개했다. 이와 함께 ‘엑사원 3.0’의 모델 학습 방법, 성능 평가 결과 등을 담은 기술 보고서(Technical Report)도 내놨다.

LG AI연구원은 2021년 12월 거대언어모델(LLM·Large Language Model) ‘엑사원 1.0’을 발표한 바 있다. 챗GPT 등장으로 인해 생성형 AI 개발 경쟁에 치열해지자, 2023년 7월 국내 대기업 중 처음으로 초대규모 AI 모델 ‘엑사원 2.0’을 공개한 바 있다.

이번에 선보이는 엑사원 3.0은 이전 버전 대비 성능·경제성을 높였다는 게 연구원 측 설명이다. 엑사원 2.0과 비교해 추론 처리 시간은 56% 감축했다. 메모리 사용량 역시 35% 줄이고 구동 비용은 72% 절감했다.

LG AI연구원 측은 “AI로 인해 촉발된 소비 전력 문제를 해결하기 위해 경량화·최적화 기술 연구에 집중했다”며 “초기 거대 모델 대비 성능은 높이면서도 모델 크기는 100분의 3으로 줄이는데 성공했다”고 전했다.

LG AI연구원은 엑사원 3.0 기술 보고서에 평가 과정에서 활용한 25개 벤치마크의 개별 점수와 영역별 평균 점수를 모두 공개해 신뢰성을 높였다. 구체적으로 ▲MT-벤치(Bench) ▲알파카에발(AlpacaEval)-2.0 ▲아레나-하드(Arena-Hard) ▲와일드벤치(WildBench) 등 대표적인 벤치마크(성능 평가 지표) 결과를 공개했다. AI 모델의 대화 성능 등 실제 사용성을 종합적으로 평가(Real-world Use Cases)하는 지표들이다.

엑사원 3.0은 실제 사용성을 비롯해 코딩과 수학 영역 등 13개 벤치마크 점수 순위에서 1위를 차지했다. ▲메타(Meta)의 라마(Llama) 3.1 ▲구글(Google)의 젬마(Gemma)2 등 동일 크기의 글로벌 오픈소스 AI 모델과의 비교해도 성능이 밀리지 않았단 뜻이다. 특히 한국어 성능도 세계 최고를 기록했다. 엑사원 3.0은 한국어와 영어를 학습하고 이해할 수 있는 이중언어(Bilingual) 모델이다.

엑사원 3.0은 특허·소프트웨어 코드·수학·화학 등 국내외 전문 분야 데이터 6000만건 이상을 학습했다. LG AI연구원은 연말까지 법률·바이오·의료·교육·외국어 등 분야를 확장해 학습 데이터를 1억건 이상으로 늘려 성능을 더 끌어올릴 계획이다.

LG AI연구원은 AI 모델에 의도적으로 공격을 시도해 기술과 서비스 취약점도 검증했다. 발견된 취약점을 보완하고 개선하는 레드티밍(Red-teaming) 과정을 수행해 안전성과 신뢰성을 높이기 위한 작업도 진행했다.

엑사원 3.0 탑재한 LG 서비스

LG AI연구원은 하반기부터 LG 계열사들과 함께 제품과 서비스에 엑사원 3.0을 적용해 새로운 제품·서비스 개발을 지원할 계획이다. ▲‘온-디바이스 AI’(On-Device AI·서버 연결 없이 기기 자체적으로 AI 기능을 수행하는 기술)에 들어갈 초경량 모델 ▲범용 목적의 ‘경량 모델’ ▲특화 분야에 활용할 수 있는 ‘고성능 모델’까지 활용 용도에 따라 모델 크기를 다르게 설계했다.

LG 계열사들은 엑사원 3.0에 각 사가 보유한 데이터를 학습시켜 ‘최적화’(Fine Tuning)할 계획이다. 이를 통해 사업·제품·서비스 혁신 속도를 높이겠단 취지다.

LG는 7일부터 임직원을 대상으로 ‘챗엑사원’(ChatEXAONE) 베타 서비스를 시작한다. 챗엑사원은 엑사원 3.0을 기반으로 만든 생성형 AI 서비스다. ▲실시간 웹 정보 기반 질의응답 ▲문서·이미지 기반 질의응답 ▲코딩 ▲데이터베이스 관리 등 업무 편의성과 효율성을 높일 수 있는 다양한 기능을 제공한다. LG AI연구원 관계자는 “생성형 AI는 입력하는 지시문 즉, 질문을 어떻게 하는지에 따라 다른 결과물을 생성한다”며 “관심 직무와 업무 특성에 맞는 질문, AI가 답변한 결과에 이어서 입력할 수 있는 질문 등을 추천해 주는 기능도 개발해 적용함으로써 생성형 AI 이용에 익숙하지 않은 임직원들도 편하게 활용할 수 있게 했다”고 말했다.

챗엑사원은 소프트웨어 개발자와 데이터 분석 전문가를 위한 기능도 제공한다. LG AI연구원은 챗엑사원이 자연어(사람이 일상적으로 사용하는 언어) 입력만으로 파이선·자바·C++ 등 22개 프로그래밍 언어를 생성할 수 있도록 만들었다. 또 데이터베이스(DB) 관리에 활용할 수 있는 ‘구조화된 질의 언어’(SQL·Structured Query Language) 쿼리까지 생성할 수 있도록 기능을 꾸렸다.

재계에선 LG AI연구원이 엑사원 3.0을 오픈소스로 공개하고 그룹 내 다양한 사업에 접목할 수 있었던 배경으로 ‘구광모 ㈜LG 대표의 의지’를 꼽는다. 구 대표는 미래 사업으로 AI를 점찍었다는 점을 이미 대외에 여러 차례 밝혀왔다. 이에 따라 대규모 투자가 이뤄졌고, 이에 따라 모델의 고도화가 진행될 수 있었단 견해다. 실제로 LG는 2020년 12월 그룹 AI 연구의 싱크탱크인 ‘LG AI연구원’을 설립한 후 지난 4년간 AI 전환 가속화를 추진했다. 생산 공정·소재 및 제품 개발·고객 서비스 개선 등 각 계열사 사업 현장에 AI 기술 적용 사례를 늘려가고 있다.

배경훈 LG AI연구원장은 “실제 산업 현장에서 활용할 수 있는 AI를 만드는 것이 중요한 만큼 특화된 성능과 경제성을 갖춘 엑사원으로 LG 계열사와 외부 기업 및 기관과의 파트너십을 강화해 나갈 계획”이라며 “특히 국내에서는 처음으로 자체 개발한 AI 모델을 오픈소스로 공개해 학계·연구 기관·스타트업 등이 최신 생성형 AI 기술을 활용할 수 있게 함으로써 개방형 AI 연구 생태계 활성화와 더 나아가 국가 AI 경쟁력을 높이는 데 기여하고자 한다”고 강조했다.