서버 망치는 원숭이, 고치는 원숭이… 넷플릭스에는 ‘사이버 교관’ 있다

서버 망치는 원숭이, 고치는 원숭이… 넷플릭스에는 ‘사이버 교관’ 있다

김민석 기자
김민석 기자
입력 2022-10-18 20:14
수정 2022-10-19 01:13
  • 기사 읽어주기
    다시듣기
  • 글씨 크기 조절
  • 댓글
    14

해외 빅테크 재난대응 어떻게

‘원숭이 부대’ 훈련 프로그램
불시에 고의로 서버 등 공격
구글 ‘DiRT’도 극단상황 설정
임직원 대응·해결 능력 강화
이미지 확대
‘카카오 사태’로 구글, 넷플릭스 등 글로벌 플랫폼 기업들의 재난 및 위기 대응 방식이 더욱 주목받고 있다. 화재 등 재난 발생 시 백업 서버 가동과 데이터 이중화를 기본으로 갖춘 것은 물론 비상 상황을 일부러 연출해 장애를 복구하는 훈련체계도 있는 것으로 알려졌다.

넷플릭스엔 업무 시간뿐 아니라 일요일 새벽 3시에도 불시에 서버 불능 상태 등 돌발 상황을 일으킬 수 있는 훈련 프로그램이 가동되고 있다. 넷플릭스는 이런 프로그램을 ‘원숭이 부대’라고 이름 지었다. 구글과 메타 등 대부분의 글로벌 빅테크 기업들은 넷플릭스처럼 자체 훈련 프로그램을 도입해 운영하고 있다. 최근 ‘카카오 먹통 사태’와 같은 일이 발생하지 않게 하기 위한 ‘사이버 교관’인 셈이다.

아마존 클라우드 컴퓨팅인 아마존웹서비스(AWS)를 기반으로 운영되는 넷플릭스는 2015년 AWS 서버 문제로 잠시 장애를 경험한 뒤 원숭이 부대를 고안했다.

이 ‘부대’엔 여러 마리의 ‘원숭이’가 소속돼 있다. ‘혼돈 원숭이’(카오스 몽키)는 ‘야생 원숭이가 서버실에 난입해 공격하고 케이블을 물어뜯는 동안에도 서비스가 중단돼선 안 된다’는 넷플릭스의 철학을 반영해 탄생했다. 이 프로그램은 업무 시간 중간은 물론 일요일 오전 3시에도 실행돼 작업을 비활성화한다. 넷플릭스는 혼돈 원숭이에 이어 서버 통신을 인위적으로 지연시키는 ‘지연 원숭이’, 규칙에 어긋나는 소프트웨어상 실체를 종료시키는 ‘적합성 원숭이’, 취약한 실체를 탐지해 서비스에서 제외시키고 종료시키는 ‘의사 원숭이’ 등을 탄생시켰다. 이에 더해 전체 클라우드 서버를 종료하는 ‘혼돈 고릴라’를 개발해 극단적인 장애 상황에 대응하는 능력을 시험하고 있다.

구글 역시 클라우드 백서를 통해 재해 발생 시에도 서비스와 사업 운영이 계속될 수 있도록 매년 전사 차원의 ‘재해 복구 테스트’(DiRT·Disaster Recovery Testing)를 시행한다고 소개했다. DiRT는 강제로 서비스가 불능 상태가 되거나 핵심 인력이 없는 상황, 지원 시스템 차단 상황 등을 의도적으로 부여하고 해결하는 훈련 방식이다.

메타 역시 전 직원이 참여하는 특별한 재해 복구 훈련 프로그램을 운영하고 있다고 밝혔다. 다만 훈련 프로그램의 이름과 구체적인 내용은 대외비에 해당된다며 공개하지 않았다.

이번 사고 대응에 실패하긴 했지만 카카오도 자체 재난 훈련 프로그램을 운영하고 있다고 설명했다. 네이버 관계자 역시 “평소 재난에 대비한 정기 훈련을 해 왔고 이번에도 훈련된 절차대로 빠르게 대처해 피해를 최소화할 수 있었다”고 말했다.
2022-10-19 2면
close button
많이 본 뉴스
1 / 3
‘남북 2국가론’ 당신의 생각은?
임종석 전 대통령실 비서실장이 최근 ‘남북통일을 유보하고 2개 국가를 수용하자’는 내용의 ‘남북 2국가론’을 제안해 정치권과 학계에서 갑론을박이 이어지고 있습니다. 당신의 생각은?
반헌법적 발상이다
논의할 필요가 있다
잘 모르겠다
광고삭제
위로