11개월 만에 돌아온 논란의 이루다, 새 버전은 뭐가 다를까
익명 처리된 DB → 알고리즘 자동 생성
AI 윤리준칙 마련…'사람 중심 AI' 초점
인공지능(AI) 챗봇 '이루다'가 돌아왔다. 지난 1월 서비스를 잠정 중단한 지 11개월 만이다. 이루다는 모두에게 좋은 친구가 되겠다는 목표로 AI 스타트업 스캐터랩이 개발한 AI 기반 대화형 챗봇(open-domain chatbot)이다. 블랙핑크를 좋아하고 사진·글로 기록하길 즐기는 등 '진짜 사람'처럼 답하는 게 특징이다.
스캐터랩은 지난해 12월 이 서비스를 출시했지만, 운영한 지 한 달도 되지 않아 중단했다. 혐오표현 학습과 개인정보 유출 논란이 걸림돌이 됐다. 지난 4월에는 개인정보보호위원회(개인정보위)로부터 1억330만원의 과징금을 받기도 했다. 스캐터랩이 서비스하는 다른 앱에서 고객의 개인정보를 수집한 뒤 목적에 맞지 않게 이용했다는 이유에서다.
스캐터랩은 올 한 해 이루다를 시장에 다시 내놓는 데 집중했다. 김종윤 스캐터랩 대표를 비롯한 회사 관계자들이 상반기부터 이루다의 윤리적, 기술적 문제를 개선하기 위한 준비에 착수했다. 이전과 달라진 '이루다 2.0'을 만들기 위해 이 챗봇이 학습했던 데이터베이스도 폐기하기로 결정했다. 내년 1월에는 이루다 2.0의 비공개 베타테스트도 앞두고 있다.
이루다 2.0, 개인정보보호·AI 윤리가 핵심
스캐터랩은 이 문제를 해결하기 위해 데이터베이스를 아예 새로 만들었다. 개인정보위가 발표한 가명 정보 처리 가이드라인에 따라 모든 데이터베이스를 가명으로 처리한 뒤, AI 모델에 학습시켰다. 이루다도 실제 대화 문장이 아닌 AI 딥러닝 알고리즘이 만들었거나 개발사가 만든 문장으로만 대화하게 했다. 수집 정보로 누군가를 특정할 수 없도록 가공 수준을 강화했다.
스캐터랩은 개발사가 잡아낼 수 없는 문제를 탐지하기 위해 새 AI 모델을 어뷰징 탐지 모델로도 만들었다. 어뷰징 탐지 모델은 선정적이거나 공격적인 대화를 찾아내 챗봇이 사용자에게 적절히 응대할 수 있게 돕는다. 예를 들어 이루다 2.0 사용자가 이전 버전에서 문제가 된 소수자 혐오 발언을 하면, 이루다가 이를 구분해 스캐터랩이 정해둔 답을 말하는 식이다.
스캐터랩, 네이버·카카오 따라 AI 윤리준칙 만들어
이번 준칙은 과학기술정보통신부가 지난해 12월 발표한 AI 윤리 기준과 네이버·카카오 등 업계 사례를 참고해 만들어졌다. 특히 네이버가 서울대와 함께 개발한 AI 윤리준칙과 거의 흡사하다. 스캐터랩은 이루다 2.0을 정식으로 출시하면 각 준칙의 세부내용을 공개할 예정이다.
스캐터랩이 개인정보 유출 의혹에서 완전히 빠져나온 건 아니다. 피해자들이 제기한 소송은 진행 중이고, 당시 사용한 데이터베이스도 폐기하지 못해 분리 보관하고 있다. 스캐터랩 관계자는 "가장 크게 달라진 건 이루다가 AI 딥러닝 알고리즘이 생성한 문장을 답한다는 점, '어뷰징 탐지 모델'을 접목해 대화에서 특정 단어를 찾고 문맥을 파악해 공격적이거나 편향적인 문장에 대응할 수 있다는 점"이라며 "개인정보보호를 강화하고 베타테스터의 의견도 반영하는 등 서비스를 개선해 출시하겠다"고 밝혔다.
선모은 기자 seon.moeun@joongang.co.kr
ⓒ이코노미스트(https://economist.co.kr) '내일을 위한 경제뉴스 이코노미스트' 무단 전재 및 재배포 금지
많이 본 뉴스
1‘검은 반도체’ 김 수출 역대 최고기록 달성…10억달러 수출 청신호
2이복현 "상법 개정보다 자본시장법 개정이 합리적"
3롯데, 해외 부실면세점 철수 검토…케미칼, 자산매각 추진
411월 기록적 폭설에 車사고 60% 급증…보험료 인상 조짐
5대한항공-아시아나 합병 4년만에 승인…통합 LCC도 출범
6이재명 “‘국장’ 떠나는 현실...PER 개선하면 ‘코스피 4000’ 무난”
7롯데바이오로직스 설립 2년 만 수장 교체…신임 대표는 아직
8상법 개정 되지 않는다면 “국장 탈출·내수 침체 악순환 반복될 것”
9열매컴퍼니, 미술품 최초 투자계약증권 합산발행