print

자체 모델 있는데…카카오가 ‘GPT 대여’ 오해받는 이유 [이코노Y]

자체 초거대 AI 모델 코(Ko)GPT 보유…2021년 공개 후 고도화
카카오 “공개 당시 ‘오픈AI 참고’ 설명의 곡해로 생긴 오해”
매개변수 300억개…빅테크와 다른 ‘가벼운 접근’도 오해 키워

카카오브레인이 고도화 중인 초거대 인공지능 언어 모델 코(Ko)GPT 설명 이미지. [제공 카카오브레인]

[이코노미스트 정두용 기자] ‘자체 기술도 없으면서….’

카카오의 생성형 인공지능(Generative AI) 서비스 내용을 다룬 기사에 자주 달리는 댓글이다. 각종 온라인 커뮤니티에도 이 같은 의견을 쉽게 찾아볼 수 있다. 카카오가 일부 선보였거나, 선보일 예정인 인공지능(AI) 기반의 신규 서비스가 ‘대여 모델’을 기반으로 한다는 인식이 대중에 퍼져있다.

카카오는 현재 ‘코(Ko)GPT’를 고도화하고 있다. 코GPT는 카카오의 자체 초거대 AI 모델이다. 회사는 이를 ▲이미지 생성 ▲챗봇 ▲헬스케어 등의 서비스에 접목, 사업적 기회를 잡겠단 전략을 추진하고 있다. 카카오는 코GPT 연구·개발을 목적으로 별도 서버도 운영 중이다.

회사 관계자는 “대중에 퍼져있는 ‘자체 AI 모델 부재’란 인식은 오해”라며 “코GPT를 기반으로 새로운 서비스 출시하기 위해 다양한 연구개발(R&D)을 진행하고 있다”고 강조했다.

‘GPT 대여’ 오해, 왜 생겼나

코GPT는 카카오그룹 내 인공지능(AI) 전문 연구 계열사 카카오브레인이 고도화 중인 초거대 AI 언어모델이다. ‘대답하는 AI’ 챗GPT(ChatGPT) 개발사 오픈AI(OpenAI)가 최근 공개한 GPT-4에 대응한다.

오픈AI는 GPT-3.5를 기반으로 챗GPT를 개발, 지난해 11월 본격적인 서비스를 시작했다. 최근엔 기존 모델보다 정확성이 40% 이상 향상된 GPT-4를 내놓기도 했다. GPT-4와 같은 거대 AI 모델이 있어야 챗GPT와 같은 생성형 서비스 구현이 가능하다.

오픈AI가 GPT-4를 통해 챗GPT를 만든 것처럼, 카카오는 코GPT를 통해 ‘한국 특화’ 서비스를 선보일 방침이다. 카카오브레인은 지난 19일 다다음(ddmm)이란 이름의 챗봇 서비스를 오픈베타(시범 서비스)로 선보이며 신규 서비스의 윤곽을 드러내기도 했다. 다다음 서비스는 베타 공개 하루 만에 1만5000명이 몰렸다. 카카오브레인은 예상보다 높은 사용량에 베타 공개 하루 만에 서비스를 일시 중단했다.
카카오브레인이 베터 서비스로 공개했다가 하루 만에 일시 중단한 AI 챗봇 서비스 ‘다다음’(ddmm)의 설명 이미지. [사진 카카오톡 채널 캡처]

카카오브레인이 코GPT를 처음으로 선보인 시점은 2021년 11월이다. 회사는 해당 모델을 공개하며 다소 생소한 GPT(Generative Pre-trained Transformer·사전 훈련된 생성 변환기) 기술을 설명하기 위해 오픈AI를 예시로 들곤 했다. 당시 오픈AI가 보유한 GPT-3는 초대규모 AI 모델의 대표적 사례로 꼽혔다.

카카오 관계자는 “카카오브레인이 코GPT를 개발하며 오픈AI의 GPT 모델을 참고한 건 맞다. 그러나 자체적인 AI 기술이 없거나 오픈AI의 모델을 임대해서 쓰는 구조는 전혀 아니다”며 “코GPT는 자체적으로 코딩해 구축한 카카오 고유의 모델”이라고 말했다.

세계 다양한 정보기술(IT) 기업 내 연구 조직은 신규 기술 개발 후 이를 학계에 논문으로 정리해 공유하곤 한다. AI 영역은 이 같은 정보 교류가 특히 활성화된 것으로 평가된다. 오픈AI 역시 GPT를 구축하며 알고리즘 효율화 등의 정보를 논문이나 오픈소스로 공개했다. 카카오브레인이 이를 참고해 코GPT를 개발했단 설명이다.

IT업계 관계자는 “카카오브레인의 코GPT 개발 방식은 특별한 게 아니라, AI 분야 전반에서 이뤄지는 통상적인 접근법”이라며 “공개된 기술을 활용해 기업이나 연구 특성에 맞게 활용하는 일은 빈번하다”고 설명했다.

챗GPT 열풍에 오해 확산

카카오브레인은 현재 코GPT 모델을 고도화해 연내 출시할 방침이다. 회사가 약 1년 6개월 전 코GPT를 공개할 당시 밝힌 매개변수(파라미터·Parameter)는 300억개다. 매개변수는 인간의 사고 과정을 구현하는 AI 개발 영역에선 ‘시냅스’(Synapse)에 해당한다. 시냅스는 사람의 뇌에서 뉴런과 뉴런을 연결한다. 시냅스가 인간의 정보 전달망이라면, AI엔 매개변수가 그 역할을 한다. 매개변수의 수가 많을수록 고도화된 기능을 구현할 수 있다.

오픈AI가 챗GPT 출시 당시 적용한 GPT-3.5 모델의 매개변수는 1750억개다. 오픈AI는 최근 공개한 GPT-4의 매개변수를 구체적으로 밝히지 않았지만, 업계에선 GPT-3.5 대비 약간 더 확장된 것으로 추정한다. 네이버가 2021년 5월 내놓은 거대 AI 모델 ‘하이퍼클로바’(HyperCLOVA)의 매개변수는 2040억개다. 네이버는 이를 고도화한 모델을 오는 7월 ‘하이퍼클로바 X’(HyperCLOVA X)란 이름으로 공개할 계획이다.

카카오브레인이 고도화 중인 현재 코GPT의 공개 당시 매개변수인 300억개 보다 많아졌으리라는 게 업계의 공통된 시작이다. 그러나 오픈AI·네이버가 구축한 모델보다 그 수가 현저히 적다.

카카오는 매개변수가 적은 대신 ‘가볍다’라는 점을 핵심으로 꼽았다. 용량이 다른 모델 대비 적어 다양한 서비스에 접목하기가 쉽다. 카카오의 핵심 서비스가 카카오톡인 만큼 초개인화 서비스를 구현하기 위해선 이같이 가벼운 모델을 최적화해 전달하는 게 중요하다는 설명이다.
카카오브레인 주요 사업 계획. [제공 카카오브레인]

카카오가 이 지점을 대중에 전하는 과정도 ‘자체 AI 모델 부재’의 오해가 퍼진 요인으로 꼽힌다. 홍은택 카카오 대표는 최근 챗GPT 열풍에 대응 방법을 설명하며 “글로벌 기업과 같은 선상에서 경쟁하기보다 자사가 가진 한국어 특화 AI 모델인 코GPT를 활용해 우리가 잘 할 수 있는 날카로운 서비스에 집중할 것”이라고 말한 바 있다. 홍 대표가 ‘빅테크와의 직접 경쟁 회피’에 대중의 이목이 쏠려 자체적인 모델 개발에 소홀하다는 인식이 확산했단 해석도 나온다.

카카오 관계자는 이에 대해 “당시 컨퍼런스콜(투자자 설명회)에서 나온 GPT 전략은 ‘특화 서비스’ 개발을 강조한 것”이라며 “핵심 서비스가 카카오톡인 만큼 이를 기반으로 생성형 AI를 작동하기 위해선 프로그램 자체가 가벼워야 한다”고 말했다. 이어 “이 때문에 최적화 과정이 매우 중요하고, 자체 AI 모델을 기반으로 한국 시장에 맞는 혁신적인 기능을 구현하는 게 개발의 핵심”이라고 덧붙였다.

카카오브레인은 최근 공개한 챗봇 ‘다다음’ 외에도 ▲AI 아티스트 ’칼로‘(Karlo)의 고도화 ▲헬스케어 AI 판독 서비스 ▲신약 개발에 AI 접목 등을 추진하고 있다. 카카오는 이와 별개로 일정 관리와 메일·캘린더의 서비스 알림 기능을 갖춘 ‘톡비서 죠르디’에 AI 기술을 접목, 개인화된 서비스로 고도화할 방침이다. 새로운 형태의 죠르디 서비스는 연내 출시를 목표로 하고 있다.

ⓒ이코노미스트(https://economist.co.kr) '내일을 위한 경제뉴스 이코노미스트' 무단 전재 및 재배포 금지

많이 본 뉴스

1中, ‘무비자 입국 기간’ 늘린다...韓 등 15일→30일 확대

2빙그레, 내년 5월 인적분할...지주사 체제 전환

3한화오션, HD현대重 고발 취소...“국익을 위한 일”

4北, '파병 대가'로 러시아서 '석유 100만 배럴' 이상 받았다

5지라시에 총 맞은 알테오젠 '급락'…김범수 처남은 저가 매수 나서

6 대통령실 "추경, 논의도 검토도 결정한 바도 없었다"

7"다 막혔는데 이거라도.." 금리 12% 저축은행 신용대출에 고신용자 몰렸다

8"자동주차 하던 중 '쾅'" 샤오미 전기차, 기능 오류로 70대 파손

9기업은행·인천대학교·웹케시, 창업기업 성장 지원 업무협약

실시간 뉴스

1中, ‘무비자 입국 기간’ 늘린다...韓 등 15일→30일 확대

2빙그레, 내년 5월 인적분할...지주사 체제 전환

3한화오션, HD현대重 고발 취소...“국익을 위한 일”

4北, '파병 대가'로 러시아서 '석유 100만 배럴' 이상 받았다

5지라시에 총 맞은 알테오젠 '급락'…김범수 처남은 저가 매수 나서