카카오 AI 아티스트 칼로, 학습량 2배 증가…‘복잡 명령’ OK, 질감 표현↑
이미지·텍스트 학습량, 1.8억서 3.0억으로 증가
이해도·표현력·속도·해상도 등 기능 전반 개선
무료 생성 이미지 수, 월 60만장으로 확대
[이코노미스트 정두용 기자] 카카오그룹의 인공지능(AI) 개발 전문 계열사 카카오브레인이 새로운 초거대 이미지 생성 모델 ‘칼로(Karlo) 2.0’을 10일 공개했다. 회사는 “사실감 넘치는 이미지를 3초 안에 그려낸다”고 강조했다. 칼로는 텍스트 형태의 제시어를 기반으로 이미지를 생성할 수 있는 AI 아티스트다.
카카오브레인이 칼로 2.0에 학습시킨 자료 집합(데이터셋)은 텍스트·이미지 약 3억장 규모다. 기존 모델이 학습한 데이터셋은 텍스트·이미지 1억8000만장. 회사는 2배 가까이 학습량을 높여 기능을 고도화했다.
카카오브레인 측은 ‘칼로 2.0’에 대해 “글로벌 최상위(Top Tier) 수준의 언어 이해력을 기반으로 완성도 높은 그림을 생성할 수 있는 성능을 갖췄다”며 “이미지상의 공간감·입체감·동물의 털과 같은 질감(텍스처)을 세밀하게 표현하는 기능 등이 보강돼 실사에 가까운 고품질 이미지 생성이 가능하다”고 전했다. ‘밝은 파란 눈동자를 가진 고양이’(A cat has light blue eyes)와 같은 복잡한 명령어(프롬프트)를 입력해도 이를 정확하게 이해하고 이미지를 생성해 낼 수 있다는 설명이다.
해상도 역시 높아졌다. 칼로 2.0가 지원하는 최대 해상도는 2048x2048이다. 생성하는 이미지의 해상도가 높을수록 다양한 이미지 크기로 작업이 가능하다. ‘모던 아티스트’ 등 지원하는 화풍도 다양해졌고, 이미지 생성 속도는 약 3초로 기존 모델(칼로 1.4) 대비 단축됐다.
카카오브레인은 국내 AI 생태계 발전을 위해 칼로 2.0의 응용프로그램인터페이스(API)도 카카오디벨로퍼스에 공개했다. 기존 칼로 1.4 모델로 제공하던 오픈 API를 칼로 2.0 모델로 업그레이드했다. 칼로 2.0은 기존 모델에 비해 ‘프롬프트 이해도’와 ‘부정 명령어’(Negative Prompt) 기능이 고도화됐다.
카카오브레인은 칼로 2.0 오픈 API를 선보이면서, 최대 500장까지 가능했던 무료 생성 이미지 수를 월 최대 60만 장으로 확대했다. 회사 측은 “스타트업 또는 개발자가 사용할 수 있는 무료 이미지 생성 횟수를 글로벌 최대 규모로 확대했다”며 “칼로 기술을 활용한 다양한 가치 창출을 지원하겠다는 카카오브레인의 의지가 담겨있다”고 강조했다.
김일두 카카오브레인 각자 대표는 “인체 비율·구도·공간감은 물론 입체감을 표현하는 투시도 등 다양한 이미지 데이터 학습 및 기술 고도화 과정을 거쳐 칼로 2.0을 선보이게 됐다”며 “많은 데이터와 사용자 피드백을 학습시켜 실사 수준의 이미지를 생성하는 동시에 보다 다양한 사용자의 니즈를 반영할 수 있는 이미지 생성 모델로 발전시켜 나갈 것”이라고 말했다.
ⓒ이코노미스트(https://economist.co.kr) '내일을 위한 경제뉴스 이코노미스트' 무단 전재 및 재배포 금지
많이 본 뉴스
1대체거래소 출범해도 IPO 기업은 상장일 다음날 거래…왜일까
2현대차와 ‘드리프트 킹’의 만남...‘아이오닉 5 N DK 에디션’ 첫 선
3“작지만 강하다”...한국 ‘여권 파워’ 세계 3위
4“무안공항 참사, 잘못된 표현”...국토부·유가족 협의 ‘공식 명칭’은
5현대차증권 2000억 규모 유상증자 계획 금감원 통과
6‘분리할 결심’ 정용진, 모친 이명희 이마트 지분 전량 매입 단행
7코스닥 입성 앞둔 데이원컴퍼니 “글로벌 K-에듀 콘테츠 기업 목표”
8“보신주의 은행장” 기업은행 노사, 임금 갈등 ‘악화일로’
9“욕 먹어도 괜찮아”...대형마트, 할인 파티 계속하는 이유