8 서비스 모니터링

개요

서비스 모니터링은 전체 IT 인프라 서비스 트리의 개요를 파악하고, 인프라의 취약한 부분을 식별하고, 다양한 IT 서비스의 SLA를 계산하고, 기타 상위 레벨의 정보를 확인하는 데 사용할 수 있는 비즈니스 레벨 모니터링입니다. 서비스 모니터링은 디스크 공간 부족, 높은 프로세서 부하 등과 같은 낮은 레벨의 세부 사항 대신 서비스의 전반적인 가용성에 초점을 맞춥니다. 서비스 모니터링은 또한 서비스가 예상대로 작동하지 않을 때 문제의 근본 원인을 찾는 기능을 제공합니다.

서비스 모니터링을 통해 모니터링 데이터의 계층적 표현을 생성할 수 있습니다.

매우 간단한 서비스 구조는 다음과 같이 보일 수 있습니다:

Service
|
|-Workstations
| |
| |-Workstation1
| |
| |-Workstation2
|
|-Servers

구조의 각 노드는 상태 속성을 가집니다. 상태는 선택된 알고리즘에 따라 계산되고 상위 레벨로 전파됩니다. 개별 노드의 상태는 매핑된 문제의 상태에 영향을 받습니다. 문제 매핑은 태깅을 통해 수행됩니다.

Zabbix는 서비스 상태 변경이 감지될 경우 알림을 보내거나 Zabbix 서버에서 자동으로 스크립트를 실행할 수 있습니다. 자식 서비스의 상태에 따라 상위 서비스가 '문제 상태'로 들어가야 하는지에 대한 유연한 규칙을 정의할 수 있습니다. 서비스 문제 데이터는 SLA를 계산하고 유연한 조건 집합에 따라 SLA 보고서를 보내는 데 사용할 수 있습니다.

서비스 모니터링은 다음 섹션으로 구성된 서비스 메뉴에서 구성됩니다:

서비스 섹션을 통해 상위 서비스를 추가한 다음 상위 서비스에 자식 서비스를 추가하여 모니터링되는 인프라의 계층 구조를 구축할 수 있습니다.

서비스 트리 구성 외에도 이 섹션은 전체 인프라에 대한 개요를 제공하고 서비스 상태 변경을 초래한 문제를 빠르게 식별할 수 있게 해줍니다.

이 섹션에서 서비스 레벨 계약을 정의하고 특정 서비스에 대한 서비스 레벨 목표를 설정할 수 있습니다.

이 섹션에서 SLA 보고서를 볼 수 있습니다.

서비스 액션

서비스 액션도 구성할 수 있습니다.

서비스 액션은 선택사항이며 다음을 허용합니다:

  • 서비스가 다운되었다는 알림 보내기
  • 서비스 상태 변경 시 Zabbix 서버에서 원격 명령 실행
  • 서비스가 다시 정상 작동할 때 복구 알림 보내기.

참고: