print

카카오·네이버 ‘먹통 복구’ 시간 차이, 원인은 ‘이중화 조치’ 여부

10월 SK C&C 데이터센터 화재, 네이버·카카오 서비스 장애
네이버 12시간 만에 복구, 카카오는 127시간 33분 소요
정부 “카카오 국민 피해 구제 원칙과 기준 마련해야”

 
 
지난 10월 15일 오후 화재가 발생한 경기도 성남시 분당구 삼평동 SK 판교 캠퍼스 A동에서 분주하게 움직이는 소방관들 모습. 해당 화제로 카카오·네이버의 서비스가 장애를 일으켰다. [연합뉴스]
SK C&C 판교 데이터센터 화재로 인해 카카오와 네이버 모두 서비스 장애가 발생했으나, 복구 시간에는 상당한 차이를 보였다. 네이버는 최대 12시간에 걸렸지만, 카카오는 127시간 33분이 필요했다. 이 같은 차이는 ‘데이터센터 간 이중화 조치’ 여부에서 발생한 것으로 나타났다.
 
과학기술정보통신부(과기정통부)와 방송통신위원회(방통위)는 지난 6일 소방청과 함께 ‘SK C&C 판교 데이터센터 화재 및 카카오·네이버 등 부가통신서비스 장애에 대한 조사 결과’를 발표했다. 또 ▶SK C&C ▶카카오 ▶네이버에 각각 시정 조치를 요구했다. 정부는 특히 “카카오는 서비스 장애와 관련된 국민 피해를 구제하기 위한 원칙과 기준을 설정하고, 보상 계획을 수립해야 한다”고 요청했다.
 
이번 발표는 지난 10월 15일 오후 3시19분께 SK C&C 판교 데이터센터 지하 3층 배터리실에서 발생한 화재가 원인이 됐다. 화재는 오후 11시 45분에 완전 진화됐지만, 건물 전력 차단 등 사유로 카카오·네이버 등 입주기업 서비스 장애가 발생했다.
 

카카오·네이버 서비스 먹통 이유는?

카카오는 당초 서비스 기능을 5개의 레이어로 구분하고, 판교 데이터센터와 기타 센터 간 체계를 이중화해 운영했다. 그러나 이번 사고에선 대기 시스템이 제대로 동작하지 못하면서 복구에 차질이 나타났다. 과기정통부 측은 “대기 서버를 동작 서버로 만들기 위한 권한 관리 기능인 ‘운영 및 관리 도구’가 판교 데이터센터 내에서만 이중화돼 있고 타 데이터센터는 그렇지 않았다”며 “판교 데이터센터의 동작 서버 작동 불능 시 서비스 장애 복구가 지연됐다”고 밝혔다.
 
또 애플리케이션(앱)·서비스 플랫폼 레이어에서도 이미지·동영상 송수신 시스템 등 서비스 구성 요소가 데이터센터 간 이중화돼 있지 않아 서비스 장애가 더 커진 것으로 나타났다. 특히 카카오 서비스를 이용하기 위한 초기 단계인 ‘카카오인증’과 같은 핵심 기능은 판교 데이터센터에 집중돼 있어 피해가 광범위하게 나타난 것으로 조사됐다. 과기정통부 측은 “카카오는 장애 탐지·전파·복구 전반에 걸쳐 기본 절차를 정의하고 있으나, 단계별 체계화 및 자동화가 미흡했다”고 지적했다.
 
반면 카카오 대비 서비스 정상화 시점이 빨랐던 네이버는 데이터센터 간 이중화 조치를 시행했다. 다만 다른 데이터센터로의 서비스 전환 과정에서 일부 기능에 오류가 발생했다. 과기정통부 측은 “대부분 기능 오류의 경우 다른 기능에 비해 상대적으로 낮은 복구 우선순위와 복구하는 데이터의 무결성 확인 등의 이유로 복구에 시간이 소요됐다”고 설명했다.
 

“1개월 내 시정조치 보고하라”

정부는 이 같은 서비스 장애가 발생하지 않도록 각 기업이 시정사항을 만들어 보고할 예정이라고 밝혔다. 단기적 조치 사항은 각 사가 선제적으로 이행하고, 중·장기적으로 조치가 필요하거나 구체적 방안 마련 등이 필요한 사안은 1개월 내 보고하라고 각 사에 전달한 상황이다.
 
정부는 이 같은 시정사항에 반영해야 할 점들도 전달했다. 카카오엔 ▶‘운영 및 관리도구’를 데이터센터 간 동작(Active)-동작(Active) 등 매우 높은 수준의 다중화 적용 ▶핵심 기능에 대한 우선순위·중요도 등을 고려해 분산·다중화를 적용할 수 있는 방안 수립 ▶재난 대비 훈련 진행 등을 마련하도록 요청했다.
 
특히 정부는 카카오가 ‘이용자 고지 및 피해 구제’에 나서야 한다고 발표했다. 과기정통부 측은 “카카오는 서비스 장애 발생 시 다양한 방식으로 신속하게 이용자에게 고지할 수 있는 체계 구축해야 한다”며 “이번 장애와 관련된 국민 피해를 구제하기 위한 원칙과 기준을 설정하고 보상 계획도 수립해 보고할 예정”이라고 밝혔다.
 
이종호 과학기술정보통신부 장관이 6일 정부서울청사 브리핑실에서 SK C&C 판교데이터센터 화재 및 카카오·네이버 등 부가통신서비스 장애에 대한 조사 결과를 발표하고 있다. [연합뉴스]
카카오가 10월 19일부터 11월 6일까지 자체적으로 접수한 피해 사례 모집에는 총 10만5116건이 올라왔다. 유료 서비스에 대한 피해는 1만4918건, 금전적 피해를 언급한 무료 서비스는 1만3198건으로 집계됐다.
 
과기정통부는 네이버를 대상으론 ‘보다 철저한 장애 예방’과 ‘신속 복구를 위해 서비스별 복구 목표’를 설정하라고 요청했다. 네이버는 이에 따라 장애 각본별 복구 방안 등을 재점검해 개선방안을 마련할 방침이다. 또 주 데이터센터 전소 등 상황을 가정하고 모의 훈련을 실시해 과기정통부에 보고할 계획이다.
 
이종호 과기정통부 장관은 “데이터센터와 디지털 서비스의 장애가 국민 일상의 불편을 넘어 경제·사회 전반을 마비시키는 등 지대한 영향을 끼쳤다”며 “이번 사고에 원인을 제공한 사업자들은 이를 엄중히 인식하고 피해 복구 및 재발 예방에 최선의 노력을 다함으로써 디지털 서비스에 대한 국민 신뢰를 다시 회복할 수 있기를 바란다”고 말했다.
 
과기정통부는 1개월 후 3사가 제출한 ▶조치 결과 ▶향후 조치계획 ▶단계별 재난관리체계 강화를 위한 전문가·사업자 의견 ▶법·제도 개선사항 등을 반영, 디지털 서비스 안정성 확보를 위한 종합적 개선방안을 2023년 1분기 내 수립할 방침이다.

정두용 기자 jdy2230@edaily.co.kr

ⓒ이코노미스트(https://economist.co.kr) '내일을 위한 경제뉴스 이코노미스트' 무단 전재 및 재배포 금지

많이 본 뉴스

1머스크 "오바마 시절 설립 미 소비자금융보호국 폐지해야"

2뉴욕 유가, 美 휘발유 증가에 혼조세…WTI, 0.07%↓

328일 서울 지하철 9호선 일부구간 '경고 파업' 철회

4‘하늘길도 꽁꽁’ 대설에 항공기 150편 결항

5‘이재명 아파트’도 재건축된다…1기 선도지구 발표

6코스피로 이사준비…에코프로비엠, 이전상장 예비심사 신청

7‘3000억원대 횡령’ 경남은행 중징계….“기존 고객 피해 없어”

8수능 2개 틀려도 서울대 의대 어려워…만점자 10명 안팎 예상

9중부내륙철도 충주-문경 구간 개통..."문경서 수도권까지 90분 걸려"

실시간 뉴스

1머스크 "오바마 시절 설립 미 소비자금융보호국 폐지해야"

2뉴욕 유가, 美 휘발유 증가에 혼조세…WTI, 0.07%↓

328일 서울 지하철 9호선 일부구간 '경고 파업' 철회

4‘하늘길도 꽁꽁’ 대설에 항공기 150편 결항

5‘이재명 아파트’도 재건축된다…1기 선도지구 발표