재해 복구란 무엇입니까?
재해 복구(Disaster Recovery, DR)는 자연 재해 또는 인재의 영향으로부터 데이터센터를 보호하는 1차 보호 전략입니다. 재해가 발생할 경우 재해 복구 계획(disaster recovery plan, DRP)을 통해 비즈니스는 신속하게 운영을 재개하거나 재해 도중 또는 재해 이후에 미션 크리티컬 기능을 유지할 수 있습니다. DR 프로세스에는 계획과 테스트가 포함되며, 일반적으로 운영 복구를 위해 별도의 물리적 사이트를 마련해야 합니다.
DR를 더 효과적으로 이해하려면 먼저 비즈니스 연속성의 관점에서 재해를 정의해야 합니다. 가장 단순하게 말해, 재해는 조직의 운영을 위험에 처하게 하는 모든 것입니다. 사이버 공격, 데이터 침해, 장비의 장애, 자연 재해 또는 심지어 전선을 갉아먹는 생쥐도 재해를 유발할 수 있습니다. 물론, 데이터 손실, 인적 오류, 멀웨어 및 바이러스, 네트워크 및 인터넷 문제, 하드웨어 및/또는 소프트웨어 장애, 날씨로 인한 재앙, 자연적 홍수 또는 배관 파열로 인한 홍수, 사무실 파손 범죄 또는 손상 중 하나도 IT 재해를 유발할 수 있습니다.
어느 DR 계획이든 재해가 발생할 경우 시스템 복구를 통해 운영을 최대한 최대한 정상적으로 지속하는 것을 목표로 합니다. 회사는 이 위기를 알게 되겠지만, 이상적으로는 고객과 최종 사용자가 어떤 방식으로든 영향을 받아서는 안 됩니다.
또한 많은 기업이 타사 제공업체를 통해 별도의 데이터센터에 서버를 복제 및 호스팅하는 모델인 DRaaS (disaster recovery as a service) 전략을 선택합니다. 설치 및 온보딩 프로세스를 간소화는 네이티브 DRaaS 솔루션을 제공하는 클라우드 공급업체도 있습니다. 온보딩이 완료되면 기업은 DR 보호의 직접적인 이점을 누릴 수 있습니다. 이 서비스는 클라우드 기반이므로 고객의 요구 사항이 확장 또는 축소됨에 따라 탄력적으로 이에 대응할 수 있습니다.
재해 복구를 실행할 경우 발생하는 이점
기업에 실행하기 쉽고 안정적으로 확립된 DR 전략을 마련할 경우, 효과적이지 못한 재해 복구로 인한 위험을 방지하는 것 외에도여러 가지 주요 이점을 얻을 수 있습니다.
RTO 및 RPO
재해 복구 솔루션을 마련하면 시스템, 서비스, 애플리케이션의 복구를 예측할 수 있습니다. 업계의 표준 서비스 수준 계약(service level agreement, SLA) 지표는 복구 시간 목표(RTO - 기업이 비즈니스 운영 중단을 견딜 수 있는 시간을 측정한 것)와 복구 시점 목표(RPO - 얼만큼의 데이터 손실을 허용할 수 있는지를 측정한 것)입니다.손실 제한
재해 복구 솔루션을 사용하면 신속하게 비즈니스 운영을 복구할 수 있으므로 오랜 다운타임으로 인한 피해가 야기하는 수익 손실과 비용이 최소화됩니다.운영 보호
비즈니스 애플리케이션은 모두 똑같지 않습니다. 따라서 효과적으로 설계된 DR 계획은 애플리케이션별로 SLA를 실행합니다. 이러한 방식으로 비즈니스 크리티컬 애플리케이션에 대한 보호를 강화할 수 있습니다.평판 보호
우수한 DR 전략은 경쟁에서 앞서나가기 위한 차별화 요인입니다. 한 기업의 고객이 재해 발생 시 기업의 회복 능력을 확인한 경우, 이 회사에 대한 고객의 전반적인 신뢰가 상승할 가능성이 큽니다.성능 향상
물리적으로 별도의 데이터센터(가능한 경우 여러 개의 원격 데이터센터 또는 서비스 제공업체 이용)에서 타겟 DR 페일오버 운영을 호스팅할 수 있으면 국지적 재해로 인한 성능 저하를 피할 수 있습니다.
기업들은 재해 복구를 어떻게 준비할 수 있을까요?
모든 기업의 고유한 요구 사항을 충족할 수 있는 하나의 보편적인 재해 복구 계획은 없습니다. 아래의 기준은 재해 복구 전략 수립을 위한 지침을 제공하지만, 해당 기업에 맞게 전략을 조정할 수 있어야 합니다.
인프라 목록 작성
DR 계획 수립을 시작할 때 하드웨어와 소프트웨어의 목록을 작성하는 것이 중요합니다. 대부분 소프트웨어를 기반으로 운영 중인 기업은 이 작업을 더 쉽게 수행할 수 있을 것입니다. 데이터센터의 물리적 구성 요소를 조사할 필요가 없기 때문입니다. 이 프로세스 중에는 모든 하드웨어 및 애플리케이션에 대해 각 공급업체의 기술 지원 담당자 정보를 파악하는 일도 수행해야 합니다.위험 평가 수행
기업이 감당할 수 있는 수준의 다운타임과 데이터 손실을 결정하십시오. 다운타임과 데이터 손실이 아예 발생하지 않는 것이 이상적이지만, 이러한 목표를 지원할 수 있는 재해 복구 솔루션을 마련할 여력이 없는 기업들도 있습니다. 전자상거래 사이트처럼 IT에 크게 의존하는 기업은 다운타임을 많이 견디지 못합니다. 위험 평가는 또한 각 애플리케이션 클래스에 허용되는 RPO 및 RTO를 알아볼 수 있는 중요한 기회입니다.커뮤니케이션 계획 수립
효과적인 커뮤니케이션 계획이 있으면 재해 발생 시 직원에게 관련 정보를 제공할 수 있고 직원은 DR 이벤트 도중 비즈니스 운영을 계속하는 데 필요한 시스템에 액세스하는 방법을 알 수 있습니다. 이러한 계획에는 재해 발생 시 운영을 계속하기 위한 위치에 대한 정보도 포함됩니다.SLA 체결
서비스 수준 계약(SLA)에 재해와 관련된 내용을 포함하십시오. 많은 기업이 서비스 제공업체에 기술을 아웃소싱하거나 시스템을 별도의 데이터센터 또는 시설에 보관합니다.정기적 재해 복구 테스트
DR 솔루션이 준비된 상태인지 정기적으로 테스트해야 합니다. 내부 또는 외부의 감사자를 만족시키려면 가장 강력한 DR 계획도 반드시 테스트해야 합니다.
재해 복구(DR) 계획을 실행하지 않을 경우 발생하는 위험
조직의 규모와 상관없이 IT는 비즈니스의 필수적인 부분을 구성합니다. 사실, 점점 더 많은 기업에게 IT는 비즈니스의 생명줄이 되고 있습니다. IT 자산과 미션 크리티컬 운영을 보호하는 일은 우선 순위 목록의 상단을 차지합니다. 견고한 DR 솔루션은 하드웨어 보호 이상의 기능을 수행합니다. 요즘에는 웹사이트에 영향을 주고 주문 처리 및 기타 미션 크리티컬 작업을 방해할 수 있는 소프트웨어 공격이 더 흔하게 발생하고 있습니다.
재해 복구 전략이 마련되어 있지 않으면 기업은 운영, 재무, 평판 측면에서 위험에 직면할 수 있습니다. 비즈니스 연속성의 관점에서 보면 재해 발생 시 기업은 효과적으로 비즈니스를 운영할 수 없고 직원은 업무를 수행할 수 없으며 고객은 이러한 저하된 운영 속도의 영향을 받을 수 있습니다. 고객은 경쟁사의 제품 및/또는 서비스를 소비하기로 결정할 수도 있습니다.
재해로 인해 발생하는 가장 명백하고 직접적인 위험은 대규모의 수익 손실일 것입니다. 거의 모든 재해는 어느 정도의 재무 손실을 유발하지만, 대응 및 복구 속도가 느릴 경우 훨씬 더 많은 자금을 잃기 쉽습니다. 안타깝게도, 느린 복구 조치로 인한 비용이 증가하고 있습니다. IT 다운타임의 평균 비용은 1분당 최대 17,000 달러에 달할 수 있습니다. 이러한 비용을 감당할 수 없는 회사도 있으므로, 한 번만 상당한 재해가 강타해도 많은 기업이 회복할 수 없을 것입니다.
마지막으로, 재해 발생 후 신속하고 효율적으로 복구하지 못하는 기업은 적절한 보안을 유지하는 신뢰할 수 있는 기업이라는 평판이 훼손될 위험에 처합니다. 우수 기업은 모두 고객 덕분에 사업을 계속 운영할 수 있다는 점을 압니다. 평판이 훼손되면 향후에 투자를 받기가 어려워질 수 있고 가치 있는 직원이 떠나게 될 수 있습니다. 일부 기업의 경우 시장에 복귀할 수 있는 가능성이 아예 사라질 수도 있습니다. 이는 기업들이 재해를 겪은 후 실패하는 경우가 많은 주된 이유 중 하나입니다.
주요 리소스 살펴보기
Nutanix DRaaS TCO 계산기
잠재적인 총 소유 비용 절감액을 빠르고 쉽게 파악할 수 있습니다.