::: 끄적끄적 :::

카카오 전 대표님 IT는 이미 충분한 피를 흘렸습니다

곰탱이푸우 2022. 10. 25. 08:30
반응형

"모든 항공 규정은 피로 쓰여졌다."

이번 데이터센터 화재로 인한 카카오 먹통 사건의 책임을 지고 물러난 남궁훈 카카오 전 대표가 남긴 메시지이다.

발언의 의도는 충분히 이해한다. 항공 안전 규정은 각종 테러와 사고로 보완하고 발전해왔다. 이번 사건의 핵심이자 피해자인 카카오도 앞으로의 운영과 발전에 반면교사로 삼겠다는 의지의 피력일 것이다.

그러나 IT 분야 종사자, 특히 항상 사건사고와 함께하는 보안업계 종사자 입장에서는 굉장히 엉뚱한 발언일 수 밖에 없다. 마지막까지 책임 회피와 면피를 위한 행동으로 느껴진다.

왜냐하면 IT 업계에서 흘린 피는 이미 차고 넘치기 때문이다.

 


관련 사고 사례는 이미 언론에서 수없이 다뤘다.
심지어 8년 전 삼성 SDS 데이터센터 화재 당시 대응했던 임직원의 회고까지 기사화될 정도였다.

 

"화재 때 우린 서버 들고 달렸다"..삼성 직원의 8년 전 기억

최근 카카오 판교 데이터센터 화재로 장기간 서비스 장애가 발생하면서 8년 전 삼성SDS 과천 데이터센터 화재 사례가 재조명되고 있다. 복구가 예상보다 지연되면서 비슷한 일을 겪었던 삼성SDS 

v.daum.net


게다가 통신선 화재 사고이기는 해도 2018년 아현동 KT 화재 때 이미 이중화와 백업의 중요성이 이미 부각된적도 있다. 문제점과 대책은 이번 사고와 판박이다.

 

[KT아현동 화재 구멍 뚫린 통신안보]백업체계도 없는 거점·지하엔 소화기 뿐..'말로만 IT한국'

[서울경제] 지난 24일 화재가 발생한 KT 아현지사는 통신망 관할범위가 가장 좁은 D등급의 시설물이었지만 통신장애로 인한 경제적 손실은 예상보다 크게 나타났다. 국민 경제에 중요한 영향을

v.daum.net


지난 15일 진행된 카카오 부사장의 인터뷰 역시 마찬가지이다.
"일단 3만2000대라는 서버가 전체가 다운되는 건 IT 역사상 유례가 없는 상황이기 때문에 그런 점에서 저희의 대처에 어려운 점이 있었다고 생각이 되고요.
화재라는 것은 워낙 예상할 수 없는 사고였기 때문에 그런 부분에 대해서까지는 화재가 나서 서버 전체가 내려가는 이런 부분까지는 대비가 부족했던 것 아닌가" -양현서 카카오 부사장

예상할 수 없었다, 유례가 없었다는 말 뿐이다. 화재 발생시 아무 대책 없이 전원을 내려버린 SK C&C도 잘한 건 없지만, DR (Disaster Discovery, 재난복구)에 대한 개념이 1도 없었다는 것을 방증한다.

 


DR 계획에는 천재지변과 전시상황도 고려해야 하기 때문이다. 경영진이 "전쟁이 나서 포격으로 특정 데이터센터가 날아가도 글로벌 서비스가 가능한가?"라는 의문을 가지지 않은 것도 이상하다.  (사실 전시상황 까지 고려하는건 좀 과한 부분이 있긴 하다.)

주식 먹튀 논란, 골목 상권 침해, 문어발식 확장 등으로 이미 돈(Money) 버는 것에 혈안이 된 기업인 것이 분명한데, 자연재해와 전시에도 서비스를 유지하고 돈을 벌 생각은 왜 안한 것일까? 장애대응과 재해복구는 돈이 되는 운영 영역이 아닌 비용으로 처리하는 정보보안 영역이라 그런 것일까?

또한 기자회견에서 개발자도구가 전체 IDC 중 판교에만 있어서 복구가 불가능했다는 말도 이해하기 어렵다. 개발자가 판교 사옥에서 판교 데이터 센터로 배포하거나 원격으로 접근하여 배포하면 다른 5곳의 데이터센터에 복제본을 생성된다는 의미가 된다. 뒤집어서 생각하면 판교 데이터센터가 최상위 꼭지점이고, 다른 지역 데이터센터는 하위에 배치된 트리 형태라는 것을 의미한다.

즉 개발 관점으로 해석하면 판교 데이터센터 자체가 단일장애점 (single point of failure, SPOF)이었다는 것이고, 보안 관점에서는 판교 데이터센터만 장악하면 카카오 전체를 장악할 수 있었다는 것을 대놓고 선언한 것이다. 인정한 것은 다행이지만 이 부분부터 장애 대응과 복구 계획에 대한  개념 자체가 부족했다는 것을 알 수 있다.

서두에서 IT분야는 이미 충분한 피를 흘렸다고 했다. 보안 업계에서 각종 사고 사례는 매일 접하기 때문에 따로 언급하지 않았지만, 당장 떠오르는 사례를 적어보면 다음과 같다.

 


1. 랜섬웨어에 걸려서 회사 전체 데이터가 날아갔어요
설마하겠지만 자주 있다. 대부분 중견-중소 업체이지만 대기업 계열사도 종종 발생한다. 데이터의 백업과 미러링과 같은 이중화에 대한 고민이 없었기 때문이다. 단일 서버 (심지어 NAS, PC도 있었다)에서만 관리했기 때문에 복구도 불가능한 경우이다.

2. Active Directory 서버 장악
최근 랜섬웨어 또는 표적공격의 트렌드는 내부에 침투한 이후 측면이동 (Lateral Movent)을 통해 중앙 AD서버를 찾아서 장악하는 것이다. 해당 서버를 장악하면 연결 된 모든 단말에 대한 타격이 가능하기 때문이다. 조직이나 사업 단위별로 구분하지 않고 특정 서버에 집중되도록 구성했기 때문이다.
외부와 격리 된 내부망에 꼭꼭 숨겨진 서버를 어떻게 공략하냐고? Cobalt Strike와 Brute Ratel에 대해 구글링 해보라. 요즘 웬만한 침해사고(유출사고)는 두 도구 중 하나가 반드시 등장한다.
요즘은 보통 AD 서버에서 전체 단말을 대상으로 랜섬웨어를 뿌려서 마비시킨다.

3. Kaseya VSA와 Solarwinds Orion 공급망 공격
해외 사례인  카세야 VSA와 솔라윈즈 오리온 사례도 있다. 클라우드로 원격 IT자산 관리 솔루션을 제공한다. 해당 업체 내부가 장악된 이후 랜섬웨어가 유포되어 해당 업체와 연결 된 고객 대부분의 단말들이 피해를 입었다.  
외부 업체에 중앙 집중 방식으로 내부 자산을 과도하게 연결한 것이 문제였다.

 

카세야 랜섬웨어 공격, '뜨거웠던 7월'의 타임라인 정리

2021년 7월, 미국의 소프트웨어 제공업체 카세야(Kaseya)에 대한 악명 높은 러시아와 관련된 랜섬웨어 그룹 레빌(REvil)의 공격으로

www.itworld.co.kr

 

“누가, 언제, 무엇을 해킹했는가” 솔라윈즈 공급망 공격 타임라인

2020년 솔라윈즈(SolarWinds) 공격에 대한 세부 사항은 계속 전개되고 있으며, 최종 피해가 집계되기까지는 몇 년이 걸릴 수 있다.&

www.itworld.co.kr

 


4. 인터넷나야나 웹호스팅 업체 랜섬웨어 감염
웹호스팅 업체인 인터넷나야나의 랜섬웨어 감염으로 고객들의 웹사이트가 날아가 버린 사건이다. 서버들은 모두 리눅스 기반 서버였는데, 이러한 리눅스 OS를 대상으로한 랜섬웨어에 의해 공격을 받았다. 당시에도 고객 데이터가 백업되지 않아 복구가 되지 않는 문제가 있었다.

 

인터넷나야나 "랜섬웨어 피해 복구중"…'해커와 13억 협상' 논란(종합) | 연합뉴스

(서울=연합뉴스) 고현실 기자 = 랜섬웨어 공격을 받은 웹호스팅 업체 인터넷나야나가 해커와 13억원에 협상을 마치고 감염서버에 대한 피해복구 작...

www.yna.co.kr


화재로 인한 서비스 장애사건은 아니지만 이런 침해사고는 하루가 멀다하고 발생한다. 기업의 정보가 유출되고 생산라인이 멈춰선다. 보안규정과 관련 법안도 지속적으로 발전해왔다. 그럼에도 각종 사고는 줄어들지 않았다. 찾으면 더 많이 찾을 수 있겠다. 이 정도로 IT 분야는 너무 많은 피를 흘려왔다.

무엇을 의미하는걸까? 규정과 법안 발전이 핵심 문제가 아니라 바로 실천 의지의 문제라는 의미이다. 구체적인 규정과 법안이 있어도 실천하지 않으면 휴짓조각에 불과하다. 아무리 좋은 계획도 실행하지 않으면 의미가 없다. 다들 어릴 때 방학 때마다 실천하지도 않을 계획표를 만들어 본 경험을 해봤을 것이다.  중요한 건 실천과 실행이지 규정과 법안이 아니다.

경영진들의 이런 멘트는 실수가 아니다. 기업 문화 자체가 이러한 부분에 신경을 쓰지 않았을 가능성이 높다. 위기 대응의 개념 자체가 없어보이고 대응이 굉장히 즉흥적이다. 자유로운 문화일 수 있지만 정제되지 않은 메시지로 혼란을 가중시킨다. 대표의 발언은 계획된 것일 수도 있다. 일종의 프레임 흔들기다.

지금 이 상황에서는 자신들도 SK C&C의 미흡한 대처로 인한 피해자라는 메시지 전달이 필요하다. 카카오가 인정하는 과실의 범위만큼 향후 SK C&C에 대한 구상권의 청구 범위가 적어진다. 법원까지 가더라도 마찬가지다. 기업의 책임보다 돈 버는 것이 우선인 카카오 입장에서는 손실금과 배상금을 SK C&C로부터 최대한 받아내야 한다. 이런 상황이기 때문에 "항공 규정은 피로 쓰여졌다" 같은 유체이탈 화법을 하는 것으로 판단된다.

 


지금은 SK C&C와 진실 공방을 하고 있다. 누가 먼저 연락을 취했는지가 핵심이다.

 

카카오-SK C&C, 데이터센터 화재 인지시점 놓고 엇갈린 주장(종합)

SK C&C "오후 3시 33분에 알려줘" vs 카카오 "전화해 파악한 시간 3시 40분께" 카카오, 기존 오후 4시 3분에서 오후 3시 40~42분으로 정정 (서울=연합뉴스) 임성호 오규진 기자 = 서비스 장애 원인과 책임

v.daum.net


화재 발생 직후 SK C&C가 먼저 공지했다면 카카오가 늦장 대응한 책임이 크므로 청구 가능한 구상권의 비율이 더 적어질 수 있다. 반대로 카카오가 장애를 인지하고 먼저 SK C&C에 문의했다면 SK C&C의 책임 비중이 절대적일 수 밖에 없다. SK C&C의 고객 보호 의무 이행을 전혀 하지 못했기 때문이다.

카카오의 대표가 사임하면서 던진 메시지로 시간을 벌고 찾아낸 대응 전략일 것으로 추측된다. 그러나 SK C&C는 캡처까지 공개하면서 일관되게 주장하고 있다. 반대로 카카오는 처음 연락이 된 시간을 약 25분 정도 앞당겨서 정정하면서도 자신들이 먼저 연락을 취했다고 주장하고 있다. 진실은 알 수 없으나 개인적으로는 일관되게 주장하고 있는 SK C&C의 주장에 설득력이 있다고 생각한다.

나 역시 심하게 물려있는 수많은 카카오 소액주주 중 한 명이다. 그리고 IT업계, 좁게는 정보보안 업계 종사자다. 그래서 이번 카카오의 대응이 너무 실망스럽다. 경영진의 면피성 발언은 구성원들의 동요는 막을 수 있어도 주주들의 동요를 일으킨다. 예전 장애 대응 때와 달라진 것이 없다. 바뀐거라고는 경영진과 날짜 정도인 것 같다. 실수도 반복되면 실력이다.

 


카카오는 자신들만의 고유한 문화와 용어 (각자대표? ㅋㅋ)들을 홍보해 왔지만, 지금 사고 대응을 보면 오히려 독으로 작용하는 모양새이다.

항공 규정이 피로 쓰여졌다면, 카카오의 성장은 주주들의 피로 이뤄졌다고 생각하는건 무리일까? 지금 카카오의 대응 수준을 보면 과하게 틀린 생각은 아닌 것 같다.

이번 사건을 계기로 2011년에 카카오가 진행한 "겁나 빠른 황소 프로젝트"가 다시 소환된다. "양치기 소년 카카오"는 언제쯤 예전의 "착한 카카오"로 돌아올 수 있을까?


반응형

'::: 끄적끄적 :::' 카테고리의 다른 글

끄적끄적 (칼럼) 메뉴 개설  (1) 2022.10.24