IT 일반

11개월 만에 돌아온 논란의 이루다, 새 버전은 뭐가 다를까

입력 2021.12.23 09:36

공유: 공유

인쇄: 인쇄

URL: URL복사

댓글: 댓글

익명 처리된 DB → 알고리즘 자동 생성
AI 윤리준칙 마련…'사람 중심 AI' 초점

인공지능(AI) 챗봇 이루다를 개발한 스캐터랩이 내년 1월 이루다 2.0의 비공개 베타테스트를 진행한다. [사진 스캐터랩]

인공지능(AI) 챗봇 '이루다'가 돌아왔다. 지난 1월 서비스를 잠정 중단한 지 11개월 만이다. 이루다는 모두에게 좋은 친구가 되겠다는 목표로 AI 스타트업 스캐터랩이 개발한 AI 기반 대화형 챗봇(open-domain chatbot)이다. 블랙핑크를 좋아하고 사진·글로 기록하길 즐기는 등 '진짜 사람'처럼 답하는 게 특징이다.

스캐터랩은 지난해 12월 이 서비스를 출시했지만, 운영한 지 한 달도 되지 않아 중단했다. 혐오표현 학습과 개인정보 유출 논란이 걸림돌이 됐다. 지난 4월에는 개인정보보호위원회(개인정보위)로부터 1억330만원의 과징금을 받기도 했다. 스캐터랩이 서비스하는 다른 앱에서 고객의 개인정보를 수집한 뒤 목적에 맞지 않게 이용했다는 이유에서다.

스캐터랩은 올 한 해 이루다를 시장에 다시 내놓는 데 집중했다. 김종윤 스캐터랩 대표를 비롯한 회사 관계자들이 상반기부터 이루다의 윤리적, 기술적 문제를 개선하기 위한 준비에 착수했다. 이전과 달라진 '이루다 2.0'을 만들기 위해 이 챗봇이 학습했던 데이터베이스도 폐기하기로 결정했다. 내년 1월에는 이루다 2.0의 비공개 베타테스트도 앞두고 있다.

이루다 2.0, 개인정보보호·AI 윤리가 핵심

스캐터랩이 이루다 2.0을 만들며 집중한 건 고객들의 개인정보를 어떻게 보호할지다. 이루다 서비스를 처음 출시했을 때 누군가를 특정할 수 있는 정보를 사용했다는 비난을 받았기 때문이다. 개인정보위의 조사에 따르면 스캐터랩은 이루다의 AI 모델을 개발하기 위한 알고리즘 학습 과정에서 특정 인물의 이름, 연락처 등 개인정보를 삭제하거나 암호화하지 않고 사용했다.

스캐터랩은 이 문제를 해결하기 위해 데이터베이스를 아예 새로 만들었다. 개인정보위가 발표한 가명 정보 처리 가이드라인에 따라 모든 데이터베이스를 가명으로 처리한 뒤, AI 모델에 학습시켰다. 이루다도 실제 대화 문장이 아닌 AI 딥러닝 알고리즘이 만들었거나 개발사가 만든 문장으로만 대화하게 했다. 수집 정보로 누군가를 특정할 수 없도록 가공 수준을 강화했다.

스캐터랩은 개발사가 잡아낼 수 없는 문제를 탐지하기 위해 새 AI 모델을 어뷰징 탐지 모델로도 만들었다. 어뷰징 탐지 모델은 선정적이거나 공격적인 대화를 찾아내 챗봇이 사용자에게 적절히 응대할 수 있게 돕는다. 예를 들어 이루다 2.0 사용자가 이전 버전에서 문제가 된 소수자 혐오 발언을 하면, 이루다가 이를 구분해 스캐터랩이 정해둔 답을 말하는 식이다.

스캐터랩, 네이버·카카오 따라 AI 윤리준칙 만들어

스캐터랩이 발표한 AI 윤리준칙에도 관심이 쏠린다. 지난해 말 이루다로 인해 AI 윤리 문제가 업계 화두로 떠올랐기 때문이다. 스캐터랩은 이루다 2.0 베타테스트를 앞두고 AI 기술과 제품 개발에 기준이 될 5개 'AI 챗봇 윤리준칙'을 수립했다. 사람을 위한 AI, 다양한 삶의 가치 존중, 함께 실현하는 AI 챗봇 윤리, 합리적 설명을 통한 신뢰관계 유지, 프라이버시 보호와 정보보안 발전 등이다.

이번 준칙은 과학기술정보통신부가 지난해 12월 발표한 AI 윤리 기준과 네이버·카카오 등 업계 사례를 참고해 만들어졌다. 특히 네이버가 서울대와 함께 개발한 AI 윤리준칙과 거의 흡사하다. 스캐터랩은 이루다 2.0을 정식으로 출시하면 각 준칙의 세부내용을 공개할 예정이다.

스캐터랩이 개인정보 유출 의혹에서 완전히 빠져나온 건 아니다. 피해자들이 제기한 소송은 진행 중이고, 당시 사용한 데이터베이스도 폐기하지 못해 분리 보관하고 있다. 스캐터랩 관계자는 "가장 크게 달라진 건 이루다가 AI 딥러닝 알고리즘이 생성한 문장을 답한다는 점, '어뷰징 탐지 모델'을 접목해 대화에서 특정 단어를 찾고 문맥을 파악해 공격적이거나 편향적인 문장에 대응할 수 있다는 점"이라며 "개인정보보호를 강화하고 베타테스터의 의견도 반영하는 등 서비스를 개선해 출시하겠다"고 밝혔다.

선모은 기자 seon.moeun@joongang.co.kr