Networking

OCI Health Checks 사용하기

OCI Health Checks를 사용하여 외부에 노출된 서비스의 모니터링하는 방법을 소개합니다..

Health Checks Service

OCI Health Checks는 인터넷에 노출된 Public Endpoint에 대해 외부 위치에서 주기적으로 Ping/TCP/HTTP 검사를 수행하여, 서비스의 상태를 확인하는 모니터링 서비스입니다.

1.Health Checks란?

OCI Health Checks 서비스는 외부에서 주기적으로 엔드포인트 상태를 점검(Probe)하여 장애나 성능 문제를 빠르게 감지하는 외부 모니터링 서비스입니다.

✔️ 웹 서비스/애플리케이션 가용성 확보
✔️ SLA 준수 모니터링
✔️ 로드밸런서 및 API 엔드포인트 상태 확인
✔️ 글로벌 vantage point 기반 멀티 리전 체크

2.Key Components (핵심 구성 요소)

2.1 Monitors (모니터)

  • HTTP 또는 Ping 기반의 지속적인 헬스 체크 수행
  • 10초 간격이면 Premium, 그보다 길면 Basic
  • 기능 차이는 없으며 빈도만 다름
  • 여러 vantage point에서 동시에 체크 가능

2.2 On-demand Probes (온디맨드 프로브)

  • API를 통해 1회성 헬스 체크 실행
  • HTTP/Ping 모두 지원
  • 24시간 기준 실행 제한 있음
  • On-demand Credits 방식을 통해 점진적으로 사용량 회복

2.3 Vantage Points (관측 지점)

  • Oracle이 전 세계에 운영하는 외부 체크 위치
  • 최소 3개 이상의 서로 다른 Provider 기반 vantage point 사용 권장
  • 다양한 네트워크/리전 시나리오에서 안정적인 체크 가능

2.4 Protocols (프로토콜)

  • HTTP/HTTPS
  • ICMP Ping
  • 각각의 프로토콜 특성에 따라 정상 여부 판단

2.5 지원되는 리소스

  • URL 또는 IP로 접근 가능한 리소스라면 Health Check 대상이 될 수 있습니다.

2.5 주요 특징

기능설명
외부 모니터링전 세계 여러 vantage point에서 Endpoint 체크
Public Endpoint 지원공용 IP, DNS 기반 서비스 모니터링 가능
HTTP/HTTPS 검사Status code, 응답시간, Body 매칭 등 심층 체크
Ping/TCP 체크네트워크 Layer 체크
알림 연동OCI Events + Notifications로 Slack/Email 알림 가능
Metrics 기반 Dashboard응답 시간/성공률 등 그래프화된 모니터링 제공

3.Policy(정책) 적용하기

 

Allow group HealthCheckAdmins to manage health-checks in compartment my-compartment

4. 탐지 프로세스 (원리)

사용자 (Console/API/CLI)
        │
        ▼
 OCI Health Checks Control Plane
        │ (설정된 모니터 정보)
        ▼
Oracle Global Vantage Points (여러 지역)
        │ (실제 HTTP/Ping 트래픽 발생)
        ▼
Customer Endpoint (Public-facing Service)
        │
        ▼ (결과 반환)
Vantage Points → Health Checks Control Plane → OCI Monitoring


5. 실제 적용하기 (OCI Web Console)

“관찰 가능성 및 관리->모니터링-> 건정성 검사” 클릭하여 이동 합니다.

“건전성 검사 생성” 클릭하여 모니터링 할 대상과 타켓을 입력 하도록 합니다.

건전성 검사 생성을 클릭하면, 모니터링 할 대상과 설정을 위한 페이지로 이동 합니다.

건정성 검사 생성을 위한 입력을 합니다.

  • 대상 :  OCI 리소스 중에서 건전성 검사가 필요한 리소스를 선택 할 수 있으며, select box로 현재 모니터링이 가능한 리소스에 대해서 리스트업이 됩니다.
  • 유리한 위치 : Azure, GCP, AWS 외부 위치한 Vantage point를 선택 할 수 있습니다. (리전에 따른 선택이 가능힙니다.)
  • 요청 유형 : HTTP, PING 두가지 타입이 선택 가능합니다.
  • 간격 : 건전섬 검사를 하기 위한 간격으로 10초부터 선택이 15분까지 가능합니다. 
  • 시간초과 : 건전성 검사를 위한 요청에 대한 응답을 실패로 하기 위한 최대 대기 시간 입니다. 

건정성 검사를 위한 데이터를 입력 후 완료가 되면 아래와 같이 건전성 검사 목록에서 등록된 건전성 검사를 확인 할 수 있습니다. (등록된 건전성 검사는 활성/비활성화를 할 수 있습니다.)

등록된 건정성 검사는 아래와 같이 상세 페이지에서 정보를 확인 할 수 있습니다.

  • 세부정보 : 등록된 건정성 검사의 프로토콜 및 Vantage points를 확인 할 수 있습니다.
  • 건전성 검사 내역 : 세부정보에서 등록된 값을 기준으로 건정성 검사한 결과 내역을 확인 할 수 있습니다.
  • 모니터링 : 메트릭 지표를 보여줍니다.

세부정보

건전성 검사 내역

모니터링

아래의 경우, Ping 결과에 따른 Latency 결과를 모니터링 하기 위해서 “Ping Test Latency Measurement” 메트릭 값을 기준으로 알람을 생성합니다.

Latency 설정을 위해서는 위 화면의 Ping Test Latency Measurement를 통해서 알람을 생성 할 수 있습니다. 알람을 만들기 위해서는 위 점 (…) 클릭 후 생성 알람 만들기를 클릭하면 아래와 같은 화면으로 이동 됩니다. 

캡처된 내용에서는 Ping Latency 과 통계는 P50으로 설정 하였습니다. (P50는 1분 동안 수집한 데이터를 순위를 매겨서 중간의 값을 확인하는 방법으로 시스템의 전체적인 흐름을 확인 할 수 있습니다.)

입력된 모니터링 지표를 통해서 e-mail로 등록된 사용자에게 메일을 시스템이 발송해 줍니다.

감사합니다. 외부에서 OCI 밖으로 노출된 즉 공용 IP를 가지고 있는 리소스에 대한 모니터링을 하기 위한 서비스로 최종 사용자에 대한 모니터링으로 사용 할 수 있는 서비스를 소개 시켜 드렸습니다. 

공식 블로그 : Health Checks Service

이 글은 개인적으로 얻은 지식과 경험을 작성한 글로 내용에 오류가 있을 수 있습니다. 또한 글 속의 의견은 개인적인 의견으로 특정 회사를 대변하지 않습니다.

INFRASTRUCTURE
oci monitoring health checks

Dialogue & Discussion