카카오, 데이터센터 화재로 인한 장애 원인 분석·재발방지대책 공개
상태바
카카오, 데이터센터 화재로 인한 장애 원인 분석·재발방지대책 공개
  • 임소희 기자
  • 승인 2022.12.07 15:12
  • 댓글 0
이 기사를 공유합니다

- 데이터센터 이중화·위기대응 과정 미흡 등 장애 원인 꼽아
카카오가 온라인으로 '이프 카카오 데브 2022'를 열어 데이터센터 화재로 발생한 서비스 장애 원인을 분석하고 재발방지대책을 공개했다. (사진=유튜브 캡처)
카카오가 온라인으로 '이프 카카오 데브 2022'를 열어 데이터센터 화재로 발생한 서비스 장애 원인을 분석하고 재발방지대책을 공개했다. (사진=유튜브 캡처)

[nbn시사경제] 임소희 기자

카카오는 7일 연례 개발자 콘퍼런스 '이프 카카오 데브 2022'를 온라인으로 열어 지난 10월 15일 판교 SK C&C 데이터센터 화재로 발생한 서비스 장애 원인을 분석하고 재발방지대책을 공개했다.

이번 '이프 카카오'는 올 한해 부족했던 부분을 솔직하게 돌아보고 기술로 더 나은 세상을 만들기 위해 다시 새롭게 나아간다는데 중점을 뒀다고 회사측은 설명했다.

행사 첫날 발표를 맡은 남궁훈·고우찬 비상대책위원회 재발방지대책 공동 소위원장과 이확영 원인조사 소위원장 및 이채영 비상대책위원회 재발방지대책 소위원회 부위원장 등 4명의 연사는 서비스 장애 원인에 대한 분석과 개선 사항을 공유하며 다시는 이런 일이 발생하지 않도록 개선하는 계기로 삼겠다는 의지를 밝혔다.

남궁훈 비상대책위원회 재발방지대책 공동 소위원장은 “지금이라도 우리는 반성하고 개선해 나가려고 한다. 그리하여 미래에는 이런 사고가 발생하지 않도록 최선을 다할 것이고 앞으로도 카카오의 서비스의 안정화가 우리의 최우선 과제이며 사회적 책임이라는 것을 항상 명심할 것”이라고 말했다.

또 그는 고우찬 재발방지 공동 소위원장을 필두로 인프라 조직을 대폭 강화하고 안정적인 서비스 환경을 조성하겠다는 목표도 제시했다.

이확영 소위원장은 "데이터센터 간 이중화와 위기대응 과정이 미흡했다"며 "하나의 데이터센터에서 장애가 발생하면 다른 데이터 센터로 자동 전환해주는 시스템이 작동해야 하는데 이 시스템도 판교데이터 센터에만 있다. 이로 인해 수동으로 전환 작업을 진행하면서 복구가 늦어졌다"고 설명했다.

이어 "카카오는 서비스 개발과 관리를 위한 운영도구들의 이중성과 안정성 확보에도 소홀했다"며 "전체 시스템의 이중화 수준은 가장 약한 시스템 이중화 수준으로 장애를 초래했다. 체계적인 이중화를 준비했어야 했다"고 진단했다.

카카오는 이프 카카오 첫날에 이어 둘째날에도 ‘1015 회고’ 특별 세션 5개를 별도로 열고 데이터센터·인프라 설비·데이터·서비스 플랫폼·어플리케이션 등 다섯 개 영역에 적용하는 다중화 기술에 관해 개별적으로 설명하는 자리를 이어갈 예정이다.  

 

2020231147@yonsei.ac.kr

nbn 시사경제, nbnbiz


주요기사