Hang 장애 사전감지
Elevisor 제품군(Oracle, J2EE)은 Hang장애 사전감지 엔진이 내장되어 장애가 발생하기 전에 장애 발생을 예측하여 운영자에게 음성이나 SMS 로 알려준다.
따라서 Elevisor 데시보드 화면을 열어 놓고 육안 모니터링 하지 않아도 되며, 야간 및 휴일등 취약시간대에도 SMS를 통하여 운영자가 알수 있다.
특히, 장애 발생 직전 운영자가 미리 알수 있으므로 장애 예방 및 조치시간의 획기적인 단축이 가능하다.
□ | Hang 장애 사전감지 프로세스 |
Hang장애 사전감지 엔진은 임계치를 초과하여 지정된 지속시간을 초과할 경우 이벤트를 발생시키고 이후 임계치 이하로 떨어질 경우 해제 이벤트가 발생한다.
기존 이벤트 관제는 임계치를 초과하게 되면 주기적으로 동일 이벤트를 지속적으로 발생시켜 운영자에게 혼란을 야기시켰으나 Elevisor는 단 한번의 이벤트발생, 해제만 발생한다.
□ | Hang장애 사전감지 성능 항목 |
Elevisor for J2EE는 7개의 항목, Elevisor for Oracle은 8개의 항목에 대하여 Hang장애 사전 감지를 수행하여 시스템의 문제에 대한 대부분의 경우에 감지가 가능하다.
□ | SMS 이벤트 메시지 샘플 |
SMS 이벤트는 임계치 초과가 지속시간까지 이어졌을 경우 "Hang 예상" 메시지가 발생하고 임계치 이하로 떨어질 경우 "Hang 자동해제" 메시지가 발생한다.
"Hang 사용자 해제" 는 사용자가 데시보드에서 해당 이벤트를 강제로 해제 하였을 경우 발생한다.
- Hang 장애 사전 감지 메시지
[회사명-Hang예상] 14:04 was2/WL01 95/90 [Active Service]
- Hang 장애가 자동해제 될 경우
[회사명-Hang 자동해제] 14:17 was2/WL01 54/90 [Active Service]
- Hang 장애 이벤트를 사용자가 해제할 경우
[회사명-Hang 사용자해제] 14:17 was2/WL01 92/90 [Active Service
□ | 클라우드 연동 |
이벤트에 대한 음성 경보 및 SMS는 해당 컨테이너를 관리하는 대상 사용자에 대해서만 보여지며 발생된다.
□ | Hang 장애 사전감지 효과 |
Hang 장애 발생 징후를 운영자가 먼저 사전에 감지하였을 경우 장애 발생전에 원인 분석 및 조치를 할 수 있으므로, 장애를 예방 및 선제적인 조치가 가능하다.
특히 End-User보다 운영자가 먼저 인지할수 있기 때문에 조치 시간을 획기적으로 단축 시킬 수 있다.
Hang 장애 징후를 감지한 시점부터 30분 후에 실제 장애가 발생한다고 가정시 1시간의 조치시간 및 장애시간을 단축 시킬 수 있다.