print

[노리시게 모리모토 IBM 아·태 지역 부사장] 데이터 선택·분류·분석 더욱 중요

[노리시게 모리모토 IBM 아·태 지역 부사장] 데이터 선택·분류·분석 더욱 중요

사진:중앙포토
최근 ‘4차 산업혁명’이란 말이 자주 등장하고 있다. 지난 1월 스위스에서 열린 세계경제포럼(WEF·다보스포럼)의 주제로 등장한 후 시작된 현상이다. 4차 산업혁명은 인공지능(AI)과 사물인터넷 등이 주도하는 시대를 일컫는다. 핵심은 데이터다. 폭발적으로 늘어나고 있는 데이터는 온라인 저장고인 클라우드를 통해 언제 어디서나 사용할 수 있게 됐다. 데이터 처리도 AI 등을 통해 보다 쉬워졌다. 데이터 활용 능력이 4차 산업혁명 시대의 핵심 과제인 셈이다. 데이터와 인공지능 분야에서 앞서가는 기업 중 하나가 미국의 IBM이다. IBM은 인공지능 왓슨을 통해 빅데이터를 분석해 다양한 분야에서 성과를 내고 있다. 통계청이 주최한 ‘2016 국가통계 발전포럼’에 참석하기 위해 최근 방한한 노리시게 모리모토 IBM 아·태 지역 부사장겸 최고기술경영자(CTO·52)를 만나 4차 산업혁명 시대 데이터의 미래에 대해 물어봤다.



4차 산업혁명 시대에 데이터의 가치가 주목받고 있다.


“4차 산업혁명은 기회이자 위기다. 지금까지 산업혁명은 1차가 기계 혁명. 2차가 전기·자동화 혁명. 3차가 인터넷 혁명이었다. 4차 산업혁명은 커넥션(연결)이다. 모바일로 사람이 연결되고 사물인터넷을 통해 모든 기기가 연결된다. 이들 기기가 정보를 주고받음에 따라 데이터가 폭증한다. 미국의 데이터 저장업체 EMC에 따르면 2020년이 되면 전 세계 데이터가 44제타(10의 21제곱)바이트까지 늘어날 것이라고 한다. 하지만 기존 컴퓨터 처리 능력은 이를 따라가지 못한다. 그렇기에 데이터 처리와 저장, 사용과 관련한 관심이 커지게 돼있다.”



기하급수적으로 늘어난 데이터에 대한 신뢰 문제가 발생할 수 있지 않을까.


“맞다. 모든 데이터가 좋은 건 아니다. 많은 데이터가 혼란을 줄 수 있다. 결국 선택(choose and pick)의 문제로 귀결된다. 데이터 활용엔 원칙이 있어야 한다. 선택·분류·분석이 핵심이다. 우선 질 좋은 데이터를 골라야 한다. 데이터가 아무리 많아도 골라낸 데이터 수준이 떨어지면 제대로 된 분석을 할 수 없다. 중요한 건 소스의 최신성이다. 낡은 데이터로 현재 상황을 분석하려 하면 안 된다. 예를 들어 의료 분야에선 과거에 사용됐던 약과 새로 만든 약을 같이 복용하면 부작용이 발생할 수 있다. 이를 제대로 업데이트 하지 않고 처방한다면 환자에게 심각한 결과를 초래할 수 있다. 데이터를 찾는 방법도 정확히 설계해야 한다. 데이터를 분류하고 범주화해 데이터를 찾는 의미와 목적을 확실히 해야 한다. 그러기 위해선 우리가 데이터를 통해 해결하고자 하는 문제가 무엇인지를 정확히 정해야 한다. 이 역할은 결국 사람이 해야 한다. 예를 들어 IBM에서는 의사의 진료를 돕기 위한 각종 서비스를 제공하고 있다. 진료 측정 데이터나 과거 병력 등 양질의 의료 정보와 데이터를 제공한다. 하지만 이를 적절히 분류해 활용하는 것은 의사다.”



데이터의 종류도 많지 않나.


“그렇다. 데이터는 우리가 일반적으로 아는 숫자만 있는 것이 아니다. 오히려 수학적으로 데이터화하기 힘든 글이나 말 같은 ‘비정형 데이터’가 훨씬 많다. 이런 데이터를 분석하는 기술이 바로 ‘인지(cognitive) 컴퓨팅’ 기술이다. 다른 말로 말하면 AI다. 다양한 비정형 데이터를 학습하고, 이를 논리적으로 추론하는 기술이다. 나아가 정보 및 사람 간의 소통으로부터 배우고, 사람과 자연스럽게 교류할 수 있는 컴퓨팅 시스템이다. AI는 학계에서 사용하는 개념이고, IBM에서는 인간 문제 해결을 강조하기 위해 ‘인지 컴퓨팅’이라는 용어를 쓰고 있다. 우리 회사가 개발한 왓슨이 대표적이다. 인지 컴퓨팅은 기존 컴퓨터의 데이터 처리 능력의 한계를 극복한다. 오히려 사람들이 일상적으로 쓰는 언어로 우리와 소통하면서 사회의 전 영역에서 활용될 것이다.”



한국에선 최근 기상청이 날씨 예보를 제대로 못해 비판 받았다. 데이터 활용 측면에서 보완할 점은 없을까.


“기상 예보는 어느 나라나 어렵다. 장기적 날씨 예측은 도박과 같다는 평가가 나올 정도다. 한국이나 일본처럼 해양에 둘러싸인 곳은 기상 상황이 더 갑자기 바뀔 수 있다. 하지만 일기예보에도 데이터가 핵심이다. 질 좋은 최신 데이터를 확보하는 게 중요하다. 과거의 낡은 기상 자료나 강수확률로 예보를 하면 오보가 나온다. 물론 최근 지구 온난화 등으로 기상 상황이 급변해 충분한 데이터가 확보되지 않을 수 있다. 그럼에도 발 빠르게 움직여 데이터 수집과 분류를 통해 질 좋은 데이터를 확보하는 능력이 중요하다. 이를 하는 건 사람이다. 기상 예보관의 역할이 중요하다.”



데이터가 폭증하면서 이를 다룰 수 있는 정부나 기업의 독점 우려가 있다.


“그 점은 별로 걱정할 일이 아니다. 44제타바이트에 이르는 많은 데이터가 있는 상황에서 어떻게 일부 기관이 데이터를 독점할 수 있을까. 오히려 데이터 민주화가 이뤄질 것이다. 클라우드 등 기술 발달로 특정 기관만이 모든 데이터를 가지기 어렵기 때문이다. 비즈니스 측면에서도 데이터 독점은 유리하지 않다. 기업이 데이터를 독점해 사업에 나서도 언젠가는 데이터를 개방할 수밖에 없다. 데이터를 계속 독점하면 특정한 사람에게만 서비스할 수밖에 없기 때문이다. 오히려 데이터 공개를 통해 더 많은 영향력을 행사할 수 있을 것이다. 물론 국가 기밀이나 개인정보 등의 데이터는 비공개 정책으로 보호해야 한다.”



빅데이터 시대엔 통계의 성격도 달라질 것 같다.


“통계와 수학은 데이터의 기본이다. 컴퓨터도 앨런 튜링이란 영국의 수학·암호학자가 만들었다. 지난 100년 간 수학을 활용한 통계가 컴퓨터와 함께 발전했다. 최근 AI 등의 기술도 수학과 통계의 진화에서 나온 것이다. AI와 수학과 통계 기술을 복합적으로 활용해 주어진 문제를 해결하는 것이다. AI로 방대한 데이터를 처리했다고 해도 그 답이 맞는지 확인하는 건 결국 수학과 통계 등 고전적 방법이다.”



인공지능으로 대표되는 4차 산업혁명 시대에 통계는 어떤 의미가 있나.


“오늘날 데이터는 너무도 많다. 통계 부문에서도 숫자(데이터)만 본다면 길을 잃을 수 있다. 데이터에서 무엇을 보고 어떤 의미를 찾을 것인지에 대한 고민이 더욱 중요해졌다. 수퍼컴퓨터가 아무리 데이터 처리를 잘해도 중요한 건 컨텍스트(맥락 또는 상황)란 이야기다. 그렇기에 각 분야 전문가가 모두 ‘데이터 과학자’가 돼야 한다. 해당 분야의 상황을 이해하면서 데이터 분석 능력도 겸비해야 한다. 이렇게 되면 결국 통계 부문은 과거보다 영역이 더 확대될 것이다. 전 분야로 퍼져나갈 것이기 때문이다.”



빅데이터 시대를 맞아 국가통계기관은 어떤 역할을 해야 하나.


“기업 등 민간이 활용할 수 있는 유용한 데이터를 제공해야 한다. 그에 앞서 지금처럼 데이터가 폭증하는 시기엔 보유한 데이터를 어디까지 외부에 공개해고 제공할지 정하는 것이 중요하다. 국가 기관이 보유한 데이터는 개인 정보 등이 많아 다른 데이터보다 그 중요성과 파급력이 크기 때문이다. 대중이 어디까지 데이터에 접근할 수 있을 것인지에 대한 표준화된 기준이 만들어져야 한다. 개인 생활 편의와 사생활 보호 같은 양립하기 힘든 문제에 대한 진지한 고민을 정부가 해야 한다.”

ⓒ이코노미스트(https://economist.co.kr) '내일을 위한 경제뉴스 이코노미스트' 무단 전재 및 재배포 금지

많이 본 뉴스

1'사과 금값' 여파...지난달 파인애플·망고 수입량 '역대 최대'

2김히어라 측 "학폭 제기자 만나 화해...기다려주신 분들께 감사"

34.8배 빠른 '와이파이 7' 도입 된다...올 상반기 상용화

4외교부 日 "독도는 일본땅" 주장에 발끈..."즉각 철회해야"

5최태원-노소영 항소심, 변론 마무리..."남은 생, 일에 헌신하겠다"

6대구시 '빅정희 동상' 등 올 첫 추경 5237억원 편성

7'더 알차게 더 재밌게' 대구 동성로 청년버스킹

8"초콜릿 처럼 달달한 커플이네" 대구 달서구, 미혼남녀 매칭 프로그램 통해 세커플 탄생

9환율, 17개월 만에 1400원 터치..."달러 강세·위험회피 심리 확산"

실시간 뉴스

1'사과 금값' 여파...지난달 파인애플·망고 수입량 '역대 최대'

2김히어라 측 "학폭 제기자 만나 화해...기다려주신 분들께 감사"

34.8배 빠른 '와이파이 7' 도입 된다...올 상반기 상용화

4외교부 日 "독도는 일본땅" 주장에 발끈..."즉각 철회해야"

5최태원-노소영 항소심, 변론 마무리..."남은 생, 일에 헌신하겠다"