- 익명 처리된 DB → 알고리즘 자동 생성
AI 윤리준칙 마련…'사람 중심 AI' 초점

스캐터랩은 지난해 12월 이 서비스를 출시했지만, 운영한 지 한 달도 되지 않아 중단했다. 혐오표현 학습과 개인정보 유출 논란이 걸림돌이 됐다. 지난 4월에는 개인정보보호위원회(개인정보위)로부터 1억330만원의 과징금을 받기도 했다. 스캐터랩이 서비스하는 다른 앱에서 고객의 개인정보를 수집한 뒤 목적에 맞지 않게 이용했다는 이유에서다.
스캐터랩은 올 한 해 이루다를 시장에 다시 내놓는 데 집중했다. 김종윤 스캐터랩 대표를 비롯한 회사 관계자들이 상반기부터 이루다의 윤리적, 기술적 문제를 개선하기 위한 준비에 착수했다. 이전과 달라진 '이루다 2.0'을 만들기 위해 이 챗봇이 학습했던 데이터베이스도 폐기하기로 결정했다. 내년 1월에는 이루다 2.0의 비공개 베타테스트도 앞두고 있다.
이루다 2.0, 개인정보보호·AI 윤리가 핵심
스캐터랩은 이 문제를 해결하기 위해 데이터베이스를 아예 새로 만들었다. 개인정보위가 발표한 가명 정보 처리 가이드라인에 따라 모든 데이터베이스를 가명으로 처리한 뒤, AI 모델에 학습시켰다. 이루다도 실제 대화 문장이 아닌 AI 딥러닝 알고리즘이 만들었거나 개발사가 만든 문장으로만 대화하게 했다. 수집 정보로 누군가를 특정할 수 없도록 가공 수준을 강화했다.
스캐터랩은 개발사가 잡아낼 수 없는 문제를 탐지하기 위해 새 AI 모델을 어뷰징 탐지 모델로도 만들었다. 어뷰징 탐지 모델은 선정적이거나 공격적인 대화를 찾아내 챗봇이 사용자에게 적절히 응대할 수 있게 돕는다. 예를 들어 이루다 2.0 사용자가 이전 버전에서 문제가 된 소수자 혐오 발언을 하면, 이루다가 이를 구분해 스캐터랩이 정해둔 답을 말하는 식이다.

스캐터랩, 네이버·카카오 따라 AI 윤리준칙 만들어
이번 준칙은 과학기술정보통신부가 지난해 12월 발표한 AI 윤리 기준과 네이버·카카오 등 업계 사례를 참고해 만들어졌다. 특히 네이버가 서울대와 함께 개발한 AI 윤리준칙과 거의 흡사하다. 스캐터랩은 이루다 2.0을 정식으로 출시하면 각 준칙의 세부내용을 공개할 예정이다.
스캐터랩이 개인정보 유출 의혹에서 완전히 빠져나온 건 아니다. 피해자들이 제기한 소송은 진행 중이고, 당시 사용한 데이터베이스도 폐기하지 못해 분리 보관하고 있다. 스캐터랩 관계자는 "가장 크게 달라진 건 이루다가 AI 딥러닝 알고리즘이 생성한 문장을 답한다는 점, '어뷰징 탐지 모델'을 접목해 대화에서 특정 단어를 찾고 문맥을 파악해 공격적이거나 편향적인 문장에 대응할 수 있다는 점"이라며 "개인정보보호를 강화하고 베타테스터의 의견도 반영하는 등 서비스를 개선해 출시하겠다"고 밝혔다.
선모은 기자 seon.moeun@joongang.co.kr
ⓒ이코노미스트(https://economist.co.kr) '내일을 위한 경제뉴스 이코노미스트' 무단 전재 및 재배포 금지
당신이 좋아할 만한 기사
브랜드 미디어
브랜드 미디어
'다승 1위' 롯데 안경 에이스, 왜 등판 밀렸나
대한민국 스포츠·연예의 살아있는 역사 일간스포츠이데일리
팜이데일리
팜이데일리
故 오요안나 가해자 지목 기캐, 끝내 결말은…
대한민국 스포츠·연예의 살아있는 역사 일간스포츠일간스포츠
일간스포츠
일간스포츠
“바람 불면 날릴 정도” 삼성, 업계 최고 수준 OLED 내놨다
세상을 올바르게,세상을 따뜻하게이데일리
이데일리
이데일리
[마켓인]롯데카드부터 애경산업까지…내달 M&A 큰장 선다
성공 투자의 동반자마켓인
마켓인
마켓인
파미셀, 줄기세포 치료제 업체에서 AI 첨단산업소재 업체로
바이오 성공 투자, 1%를 위한 길라잡이팜이데일리
팜이데일리
팜이데일리