가용성

1. 가용성

  • 클라우드서비스의 가용성(Availability)은 서비스가 장애 없이 정상적으로 운영되는 능력을 말한다.
    • 클라우드서비스의 정상적인 운영은 서비스 접근성과 적절한 응답시간이 보장되며, 유효한 서비스 요청에 대해 오류 없이 운영되는 것을 말한다.
  • 클라우드서비스 제공자는 가용성을 측정하여 목표 수준을 제시함으로써 서비스 지속성을 보장하고, 서비스 이용자의 서비스 중단에 대한 불안을 최소화하여 서비스에 대한 신뢰성을 확보할 수 있다.

1.1 가용률

  • 가용률은 정해진 서비스 운영 시간(예정된 가동시간) 대비 클라우드서비스에 접속이 가능한 시간(실제 가동시간)의 비율을 말한다.
  • 클라우드서비스를 대상으로 서비스가 장애 없이 지속되는지를 확인하고, 가용률을 관리함으로써 이용자에게 서비스 지속성에 대한 신뢰성을 향상시키고, SLA 준수여부를 확인할 수 있다.
  • 가용률은 다음과 같은 점검 항목을 통해 확인할 수 있다.
품질·성능 기준 점검요소 점검항목 점검방법 참고 페이지
관리체계
점검
품질성능
점검
가용성 가용률 가용률 유지능력 가용률 보장을 위한 관리체계 및 운영정책 35
가용률 서비스 인스턴스 가용률 67
플랫폼 서비스 가용률 70
애플리케이션(SW) 서비스 가용률 72
가용성 모니터링 지원 가용성 모니터링 기능 75

1.1.1 가용률 유지능력 점검

  • 가용률 유지능력은 갑작스런 클라우드서비스의 장애로 인해 서비스가 중단되는 우려를 최소화 하기 위해 가용률 기준을 제시하고, 이를 보장하기 위한 관리 정책ㆍ기술을 보유하고 있는 것을 말한다.
  • 클라우드서비스 제공자는 서비스 가용률을 약정된 내용에 따라 상시적으로 제공하기 위해 제반 조치를 관리할 수 있다.
점검 항목 확인사항
가용률 정책
  • 가용률 수준을 보장하기 위해 관리/운영에 필요한 사항들을 정의하여 정책을 수립하고 있는가?
가용률 목표제시
및 결과 통지
  • 이용자에게 서비스 가용률 수준을 사전에 제시하고 있는가?
  • 주기적으로 가용률 수준을 알 수 있도록 관련 프로세스를 마련하고 있는가?
조직 및 책임 설정
  • 주기적으로 이용자에게 서비스 가용률 수준을 알리기 위해 서비스 장애시간, 장애 발생 사유, 통지 인력·프로세스, 보고이력의 관리 등의 내용과 절차를 마련하여 계약서, 약관 또는 SLA에 반영하고 있는가?
시스템 도입·관리
  • 서비스의 가용률 수준을 보장하기 위해 가상화, 분산 컴퓨팅 등의 적정한 클라우드 기술/소프트웨어 등을 도입하여 시스템을 구성하였는가?
  • 장애에 대비하여 모니터링, 이중화, 유지/보수할 수 있도록 준비하고 있는가?

1.1.2 서비스 인스턴스 가용률 측정

  • 클라우드서비스 인스턴스는 물리적 컴퓨팅 시스템 상의 가상화 기술을 기반으로 상호 독립적으로 동작하는 운영체제를 탑재한 가상머신 혹은 컨테이너로 서비스 인스턴스가 정해진 서비스 운영 시간 대비 실제 운영되는 시간의 비율을 측정한다.
  • 서비스 인스턴스의 가용률은 인프라 서비스(IaaS)를 기반으로 동작하는 플랫폼 서비스(PaaS), 애플리케이션 서비스(SaaS)의 가용성에 영향을 준다.
  • 서비스는 네트워크 장애, 서버 HW 장애, SW 동작 및 버그 장애, 서비스 부하로 인한 요청 타임 아웃, 서비스 점검 등으로 인하여 서비스 다운타임이 발생할 수 있다.
점검 항목 확인사항
서비스 인스턴스 가용률
  • 서비스 인스턴스의 총 운영시간 대비 실제 이용 가능한 시간의 비율은 얼마인가?
  • 측정한 가용률이 목표수준(SLA)을 만족하는가?

1.1.3 플랫폼 서비스 가용률 측정

  • 클라우드 플랫폼 서비스는 서비스 이용자가 인프라에 대한 관리, 제어 없이 이용자 SW를 개발 및 배포할 수 있도록 지원하는 플랫폼을 제공하는 서비스(PaaS)로 플랫폼 서비스를 기반으로 동작하는 애플리케이션(SW) 서비스(SaaS)는 플랫폼 서비스의 가용성에 영향을 받는다.
  • 플랫폼 서비스에 대한 가용성은 제공된 플랫폼 서비스의 정해진 서비스 운영 시간 대비 실제 플랫폼을 이용할 수 있는 운영되는 시간의 비율을 측정한다.
점검 항목 확인사항
플랫폼 서비스 가용률
  • 플랫폼 서비스의 총 운영시간 대비 실제 서비스 운영시간의 비율은 얼마인가?
  • 측정한 가용률이 목표수준을 만족하는가?

1.1.4 애플리케이션(SW) 서비스 가용률 측정

  • 애플리케이션(SW) 서비스는 인프라 및 플랫폼 서비스를 기반으로 애플리케이션을 제공하는 클라우드서비스(SaaS)로 정해진 서비스 운영 시간 대비 실제 애플리케이션을 이용할 수 있는 운영되는 시간의 비율을 측정한다.
  • 애플리케이션 서비스의 가용률은 인프라/플랫폼 서비스의 가용률에 영향을 받으며, 애플리케이션 자체적인 오류나 결함 등의 사유로 인프라/플랫폼 서비스의 가용률과 상이할 수 있으므로 인프라/플랫폼 서비스와 별도로 애플리케이션 서비스에 대한 가용률 점검이 필요하다.
  • 애플리케이션 서비스의 가용률 측정 시, 실질적으로 이용자가 요청한 서비스 기능이 정상적으로 동작하는지를 고려하여 측정할 수 있다. SW품질을 기반으로 한 IT 서비스 품질 표준에서 가용률은 사용자가 필요로 할 때 IT 서비스가 사용가능한 정도로 측정된다.
점검 항목 확인사항
애플리케이션 서비스 가용률
  • 애플리케이션 서비스의 총 운영시간 대비 실제 서비스 운영시간의 비율은 얼마인가?
  • 측정한 가용률이 목표수준을 만족하는가?

1.1.5 가용률 모니터링 기능 확인

  • 가용성 모니터링은 클라우드서비스 및 시스템의 서비스 지속상태를 확인하기 위해 서비스 제공 자 혹은 이용자에게 가용성 정보를 제공하는 것을 말하며, 이를 통해 현재 서비스 상태와 가용성 수준을 확인할 수 있다.
  • 클라우드서비스 제공자는 가용성 모니터링을 통해 현재의 운영 상태 및 잠재적인 문제를 미리 조치함으로써 가용성 수준을 유지·개선할 수 있고, 클라우드서비스 이용자는 가용성 수준에 대 한 객관적인 정보를 제공받을 수 있다.
점검 항목 확인사항
가용성 모니터링 기능
  • 서비스 운영 상태 정보가 정상적으로 제공되는가?
  • 서비스 장애에 대한 알림 기능이 정상적으로 제공되는가?
  • 모니터링 결과에 대한 로그 기능이 정상적으로 제공되는가?