print

‘카카오 먹통’ 관련 3사, 과기정통부에 후속 보고서 제출…안전망 제도 내달 발표

제도적 안전망, IDC운영·플랫폼 기업에 적용 권고
카카오·네이버·SK C&C, 단기적 조치 적용 완료

2022년 10월 15일 화재가 발생한 경기도 성남시 분당구 삼평동 SK 판교 캠퍼스 A동에서 분주하게 움직이는 소방관들 모습. 해당 화재로 카카오·네이버가 제공하는 서비스에서 장애가 발생했다. [사진 연합뉴스]

[이코노미스트 정두용 기자] SK C&C 판교 인터넷데이터센터(IDC) 화재로 인해 발생한 이른바 ‘카카오 먹통’ 사태 관련 3사(카카오·네이버·SK C&C)가 정부에 후속 보고서를 제출한 것으로 확인됐다. 해당 사고 후속 관리 주무 부처인 과학기술정보통신부(과기정통부)는 3사가 제출한 내용을 기반으로 ‘재발 방지’를 담보할 수 있는 제도를 마련해 이른 시일 내 발표할 방침이다.

22일 과기정통부에 따르면 카카오·네이버·SK C&C는 최근 부가통신서비스 장애에 대한 일차적 조치 사항을 담은 보고서를 제출했다. 이는 지난해 10월 15일 SK C&C 데이터센터에 불이 나면서 발생한 서비스 장애에 대한 후속 조치다. 과기정통부는 각 사가 제출한 보고서 내용과 사고 원인 조사 결과 등을 토대로 재발 방지대책을 마련, 오는 3월에 발표한다. 과기정통부는 이와 함께 재난관리체계 강화를 위한 전문가·사업자 의견과 법·제도 개선사항의 검토 내용도 공개할 계획이다.

디지털 서비스 = 기초 인프라

네이버·카카오 등이 제공하는 플랫폼 기반 서비스는 소통·금융·교통 등 일상 생활과 밀접하다. 정부는 플랫폼 기업이 제공하는 디지털 서비스를 사회 기초 인프라(Infrastructure·기반 시설)로 보고, 이 같은 기능 중단이 다시 발생하지 않도록 제도적 안전망을 마련한다. 과기정통부가 마련한 제도는 모든 데이터센터 운영사와 온라인 서비스 제공 기업에 적용이 ‘권고’ 수준으로 전달될 것으로 보인다.

정부는 판교 SK C&C 데이터센터 화재로 전 국민이 이용하는 카카오 서비스 대다수와 네이버 일부 기능이 멈추자, 이를 ‘재난’으로 규정했다. 양사의 서비스 중단이 국민 대다수의 일상에 영향을 미친 데 따른 대응이다.

과기정통부는 윤석열 대통령 지시에 따라 내부에 디지털재난대응 태스크포스(TF)를 마련하고, 조속한 정상화를 지원했다. 카카오의 서비스가 모두 정상화되기까진 127시간 33분이 소요됐고, 네이버는 12시간이 필요했다. 네이버의 경우 서비스 장애 범위가 ‘일부 기사 댓글 이용 불가’ 정도로 한정적인 데다 서비스 정상화도 비교적 빨랐다. 해당 사고가 ‘카카오 먹통’ 사태로 불리는 이유다.

과기정통부는 화재 후 약 넉 달이 지난 지금도 디지털재난대응TF를 운영하며 후속 조치를 진행하고 있다. 카카오·네이버·SK C&C가 과기정통부에 주요 사고 원인에 대한 개선 사항과 향후 계획을 수립해 보고한 일도 후속 조치의 일환이다. 과기정통부에 따르면 카카오와 네이버 모두 당시 서비스 중단에 직접적인 원인이 된 사안을 현재 모두 수정해 자사 서비스에 반영한 상태다.
남궁훈(왼쪽)·홍은택 카카오 각자대표가 2022년 10월19일 경기 성남시 카카오판교아지트에서 데이터 센터 화재로 인한 대규모 먹통 사태와 관련해 대국민 사과를 하고 있다. 남궁 각자대표는 ‘카카오 먹통’ 사태에 대한 책임을 지고 이날 사퇴했다. [사진 연합뉴스]

여실히 드러난 ‘총체적 난국’ 얼마나 해결될까

과기정통부는 사고 발생 약 두 달 후 사고 발생 경과와 서비스 중단 원인 등을 조사한 결과를 방송통신위원회(방통위)와 소방청과 함께 발표한 바 있다. 당시 공개된 자료에 따르면 SK C&C는 판교 데이터센터에 ▲배터리 온도 감시 시스템 ▲가스 소화 장비 ▲무정전 전원장치 등 안전장치를 마련했다. 다만 화재가 발생한 배터리실 온도 감지 시스템이 이상 징후를 포착하지 못했고, 가스 소화 장비가 리튬이온 배터리 화재의 특성상 초기 진압에 한계를 보였다. 무정전 전원 장치 역시 화재 열기로 인해 가동이 중지돼 서버 가동 중단의 원인이 됐다. 또 실제 화재 상황 수준을 반영한 세부 대응계획 역시 마련되지 않은 것으로 조사됐다.

주요 서비스 모두가 중단된 카카오의 경우, 대기 서버를 동작 서버로 만들기 위한 권한관리 기능인 ‘운영 및 관리도구’를 판교 데이터센터 내에서만 이중화해 운영했다. 한 데이터센터가 일시에 불능이 되는 상황에 대비 불가능한 구조였고, 이에 따라 대다수 서비스가 중단과 복구 시간 지연 등이 나타났다. 반면 네이버는 데이터센터 간 이중화 조치를 시행하고 있어 주요 서비스의 중단이 없었고, 서비스 복구 역시 상대적으로 빨랐다.

과기정통부는 이 같은 조사 결과를 토대로 기업별로 요청 사항을 전달했다. SK C&C에는 ▲배터리 감시 시스템의 강화 ▲리튬이온 배터리 화재 시 필요한 소화설비 구축 ▲배터리실 전력선 재배치 ▲전력 개발 차단 방안 마련 ▲재난 대응 각본 및 세부 훈련 계획 수립 등을 촉구했다. 카카오엔 ▲데이터센터 간 다중화 적용 ▲인증·메시지 등 주요 서비스에 대한 높은 수준의 분산화 방안 수립 ▲데이터 전소·연결망 마비 등에 대비한 훈련 계획 수립 등을 요구했다. 네이버는 데이터센터 전소 상황을 가정한 모의 훈련 실시 정도의 내용을 전달했다.
세종시 세종파이낸스센터에 위치한 과학기술정보통신부 현판. [사진 과학기술정보통신부]

3사는 이 중 단기적으로 실행이 가능한 지점을 모두 조치한 후 과기정통부에 보고했다. 과기정통부는 이와 함께 장기적 조치가 필요한 사항의 경우 이행 여부를 지속해 확인할 방침이다. 과기정통부 관계자는 “가장 문제가 된 카카오의 서비스 중단의 가장 큰 원인인 데이터센터 간 이중화 조치는 하드웨어적 문제가 아닌 소프트웨어적 문제라 비교적 빠른 적용이 가능했다”며 “디지털 서비스가 이번 사태로 국민 생활에 미치는 영향력이 크다는 점을 재확인한 만큼, 제도적으로 다시는 서비스 중단이 없도록 치밀한 안전망을 마련할 것”이라고 말했다.

카카오는 과기정통부의 요청 사항과 별개로 지난해 12월 7일 개발자 콘퍼런스 ‘이프 카카오 데브(if kakao dev) 2022’를 열고 자체적으로 파악한 서비스 장애 원인 분석 결과와 재발 방지대책을 발표했다. 재난복구(DR) 시스템을 데이터센터 3개가 연동되는 삼중화 이상의 환경으로 구축한다는 게 핵심이다. 이와 함께 5년간 서비스 안정화 투자를 기존 대비 3배로 확대하는 방안도 내놓은 바 있다.

ⓒ이코노미스트(https://economist.co.kr) '내일을 위한 경제뉴스 이코노미스트' 무단 전재 및 재배포 금지

많이 본 뉴스

1‘리들샷’ 대박 브이티, 1분기 영업익 240억…전년 대비 3780%↑

2LH, 영주귀국 사할린 동포 122세대 임대주택 지원

3식품·바이오 호조…CJ제일제당, 1Q 영업익 48.7% ↑

4강신숙 수협은행장 “은행과 직원이 함께 성장하는 기업문화 정착”

5트랜스베버리지, 프리미엄 버번 위스키 '와일드 터키 81' 리뉴얼 출시

6정원정 기아 국내사업본부장, ‘전기차 캐즘’ 극복 가능할까

7“성능 좋아졌는데”...기아, EV6 가격 동결 ‘승부수’

8해초명함‧디지털명함…은행권 ‘특별한 명함’ 내놓은 사연은

9국민 연고 후시딘, 상처치료제 선도 제품 된 비결은

실시간 뉴스

1‘리들샷’ 대박 브이티, 1분기 영업익 240억…전년 대비 3780%↑

2LH, 영주귀국 사할린 동포 122세대 임대주택 지원

3식품·바이오 호조…CJ제일제당, 1Q 영업익 48.7% ↑

4강신숙 수협은행장 “은행과 직원이 함께 성장하는 기업문화 정착”

5트랜스베버리지, 프리미엄 버번 위스키 '와일드 터키 81' 리뉴얼 출시