신뢰성

4. 신뢰성

  • 클라우드서비스의 신뢰성(Reliability)은 클라우드서비스 제공자가 클라우드서비스를 정상적으로 운영할 수 있는 능력을 의미한다.
  • 클라우드서비스는 기반이 되는 하드웨어 및 소프트웨어 구성요소의 고장이나 결함의 영향을 받거나 데이터 센터 내의 시설과 인프라 측면에서도 잠재적 결함이 발생할 수 있으므로, 서비스 제공자는 서비스의 지속성을 보장하고 이용자에게 서비스 중단에 대한 불안을 최소화하기 위해 신뢰성을 확보해야 한다.
    • 신뢰성 확보를 위한 요소는 크게 서비스 탄력성/장애 허용성, 고객 데이터 백업 및 복구, 재난 복구 등으로 구분할 수 있으며, 품질·성능 기준에서는 위 요소에 따른 서비스 회복시간, 주기적 백업/백업준수율, 백업데이터 보관기간을 제시한다.

4.1 서비스 회복 시간

  • 클라우드서비스의 서비스 회복시간은 클라우드서비스 중단시점부터 정상 상태로 복귀하기까지 소요된 시간이다.
  • 서비스 회복시간은 다음과 같은 점검 항목을 통해 확인할 수 있다.
품질·성능 기준 점검요소 점검항목 점검방법 참고 페이지
관리체계
점검
품질성능
점검
신뢰성 서비스회복시간 서비스 회복시간 서비스 회복시간 99
고가용성 환경에서의 서비스 회복시간 102
백업 이미지/스냅샷 복구 소요시간 104

4.1.1 서비스 회복시간 측정

  • 서비스 회복시간은 클라우드서비스가 중단된 시점부터 정상적인 상태로 회복되기까지 소요된 시간을 말한다.
  • 서비스가 중단된 시점을 장애로 판단하고, 장애 발생 시점부터 서비스의 복구 시점까지 소요되 는 시간을 측정할 수 있다.
  • 서비스 장애 등으로 인한 서비스 복구가 필요한 경우, 사전에 서비스 회복시간을 확인함으로써 복구에 소요되는 시간을 예측할 수 있다.
점검 항목 확인사항
서비스 회복 시간
  • 일정기간 동안의 장애시간과 장애횟수 측정 결과, 평균 서비스 회복시간이 목표 수준을 만족하는가?(MTTR)
  • 최대 서비스 복구시간은 목표 수준 대비 적정한가?(MTTSR)

4.1.2 고가용성 환경에서의 서비스 회복시간 측정

  • 서비스 이중화는 동일 기능을 수행하는 일부 서버 혹은 서비스 구성 요소를 사용할 수 없는 경우, 다른 서버 등을 통해 서비스를 계속 제공하는 것을 의미한다. 이를 통해 단일 장애점을 제거함으로써 장애가 발생해도 서비스를 지속적으로 제공이 가능하다.
  • 클라우드서비스의 연속성을 지속적으로 유지하기 위해 클라우드서비스 제공자는 이중화 등의 HA(High Availability)구조나 FT(Fault Tolerance) 시스템을 도입할 수 있다.
  • 이 경우의 서비스 회복시간은 장애를 인지하고 대기 중인 시스템으로 이관(Failover) 되기까지의 소요시간이 될 수 있다.
점검 항목 확인사항
고가용성 환경에서의 서비스 회복시간
  • 서비스 회복시간을 최소화하기 위한 시스템 구조가 마련되어 있는가?
  • 고가용성 환경에서 자동 Failover 기능이 정상적으로 수행되는가?
  • Failover 시 서비스 장애시간은 적장한가?

4.1.3 백업 이미지/스냅샷 복구 소요시간 측정

  • 클라우드 인프라(IaaS) 서비스는 가상머신의 데이터/상태를 저장하기 위해 스냅샷 또는 서버 이미지를 저장하는 기능을 제공하고 있다. IaaS 서비스를 이용하는 이용자(SaaS 서비스 제공자 포함)는 클라우드서비스의 장애를 대비하여 서버의 상태 및 데이터를 스냅샷 또는 이미지 형태로 저장할 수 있다.
  • 서비스 회복시간은 스냅샷 또는 이미지를 이용하여 서비스의 상태를 복원하는 시간을 측정하게 된다.
점검 항목 확인사항
백업 이미/스냅샷 복구 소요시간
  • 서비스 노드들을 이미지 또는 스냅샷으로 저장하고 있는가?
  • 백업된 데이터(서버 이미지, DB 데이터 등)를 이용하여 서비스 복구 시, 복구 시간은 적정한가?

4.2 백업 주기

  • 클라우드서비스의 백업 주기는 정기적으로 수행하는 데이터 백업의 주기를 말한다.
  • 백업 주기는 다음과 같은 점검 항목을 통해 확인할 수 있다.
품질·성능 기준 점검요소 점검항목 점검방법 참고 페이지
관리체계
점검
품질성능
점검
신뢰성 백업 주기 주기적 백업 백업 시스템 확보 및 관리, 주기적 백업 시행 여부 45

4.2.1 주기적 백업 점검

  • 서비스 장애 및 오류, 잘못된 조작 등으로 인한 데이터나 정보의 손상에 대비하여, 서비스 제공자는 주기적(일/주/월 등)으로 백업을 할 수 있도록 시스템을 확보하고, 주기적으로 데이터의 백업을 수 행한다.
점검 항목 확인사항
백업시스템 확보 및 관리
  • 클라우드서비스 제공자는 재해, 재난, 무단 접근 등 위협으로부터 이용자의 데이터를 안전하게 보호/관리하기 위해 백업 시스템을 확보/관리하고 있는가?
주기적 백업
  • 데이터 관리 정책이나 계약 등에서 정하는 바에 따라 백업을 시행하고 있는가?

4.3 백업 준수율

  • 클라우드서비스의 백업 준수율은 계획된 총 백업 건수(정기 및 수시 백업) 중 정상적으로 실시된 백업의 비율을 말한다.
  • 백업 준수율은 다음과 같은 점검 항목을 통해 확인할 수 있다.
품질·성능 기준 점검요소 점검항목 점검방법 참고 페이지
관리체계
점검
품질성능
점검
신뢰성 백업 준수율 백업 준수율 데이터 백업 준수율 106
백업/복구 기능 백업 및 복구 기능 108

4.3.1 데이터 백업 준수율 확인

  • 백업 준수율은 서비스 제공자가 운영·관리 정책에 따라 계획된 총 백업 건수 중 정상적으로 실시된 백업의 비율을 의미한다.
  • 백업 준수율은 서비스 제공자가 서비스 복구를 위해 필요한 이용자 데이터, 운영 데이터 등을 주기적으로 백업되고 있음을 확인함으로써 서비스 장애 등으로 복구가 필요한 경우, 백업 시점으로 서비스 복구가 가능하다.
점검 항목 확인사항
데이터 백업 준수율
  • 계획된 총 백업 건수 대비 정상적으로 실시된 백업의 비율은 얼마인가?
  • 백업 데이터는 지정한 저장소에 저장되어 있는가?
  • 산정된 백업 준수율이 목표수준을 만족하는가?

4.3.2 백업 및 복구 기능 확인

  • 백업은 시스템의 장애, 재해 혹은 침해 등으로 인한 정보 유실로부터 데이터를 복원할 수 있도록 파일 또는 DB 데이터를 별도의 저장소에 복사하여 저장하는 것을 말하며, 복구는 손실된 데이터를 원상 복귀하는 것을 말한다.
  • 백업 이력이나 백업 데이터의 존재만으로는 신뢰성 있는 데이터 복구를 보증할 수 없으므로 주기적으로 백업 데이터에 대한 복원 테스트를 수행하여 백업 및 복구의 정상 동작 상태를 확인하여야 한다.
점검 항목 확인사항
백업/복구 기능
  • 백업 기능 실행 후 백업 데이터가 원하는 형태(파일, 이미지 등)로 저장되는가?
  • 백업 데이터를 통해 백업 시점의 최신 데이터가 복원되는가?
  • 백업 데이터를 통해 서비스를 정상 복구할 수 있는가?
  • 백업 데이터가 운영 시스템과 분리되어 저장되어 있는가?

4.4 백업 데이터 보관 기간

  • 클라우드서비스의 백업 데이터를 보호ㆍ유지(서비스 이용 후 반환 및 폐기 포함)하는 기간을 말한다.
  • 백업 데이터 보관 기간은 백업대상 데이터 용량과 함께 백업시스템의 용량을 산정하는 중요한 기준이 된다. 보관 기간은 데이터의 중요도에 따라 다르게 적용되는데, 각 기관별로 보유한 자료보존연한 등 시스템 외부적인 요인에 의해 결정될 수 있다.
  • 백업 데이터 보관 기간은 다음과 같은 점검 항목을 통해 확인할 수 있다.
품질·성능 기준 점검요소 점검항목 점검방법 참고 페이지
관리체계
점검
품질성능
점검
신뢰성 백업 데이터 보관 기간 데이터 보관, 반환 및 폐기 데이터 보관 및 폐기 정책의 수립 및 준수 여부 48

4.4.1 데이터 보관, 반환 및 폐기 점검

  • 클라우드서비스 제공자는 이용자의 데이터를 보관, 폐기하기 위한 정책을 수립하여야 하며, 주요내용으로는 데이터 보관/폐기 범위, 절차, 방법, 시점 등을 포함할 수 있다.
점검 항목 확인사항
데이터 보관 정책
  • 클라우드서비스 이용자의 데이터를 보관하기 위한 정책을 수립하고, 이를 시행하고 있는가?
데이터 반환 정책
  • 클라우드서비스 이용자의 요청이 있거나, 또는 법령에서 정하는 경우 등에 대비하여 데이터를 반환하기 위한 정책을 수립하고, 이를 시행하고 있는가?
데이터 폐기 정책
  • 클라우드서비스 이용자의 요청이 있거나, 또는 법령에서 정하는 경우 등에 대비하여 데이터를 폐기하기 위한 정책을 수립하고, 이를 시행하고 있는가?