Presentation
MSA 환경을 위한 애플리케이션 모니터링
MSA 전환 및 클라우드 네이티브 환경 구축을 고민하고 계신 분들이라면 발표자료를 통해 성공 전략을 꼭 확인해보세요!
2025년 03월 21일

MSA 환경을 위한 애플리케이션 모니터링
MSA(Micro Services Architecture) 환경에서 애플리케이션을 효율적으로 모니터링하고 관리하는 방법을 다룹니다.
‘MSA 환경을 위한 애플리케이션 모니터링’ 발표 영상
‘MSA 환경을 위한 애플리케이션 모니터링’ 핵심내용
SLA 모니터링의 목적과 특징

- SLA 모니터링의 주된 목적은 고객 서비스의 장애 시간을 월 단위로 분석하여, 서비스가 정상적으로 운영되고 있는지를 확인하는 데 있습니다.
- 또한, 실시간으로 웹 서비스 품질을 모니터링하여 응답 코드와 콘텐츠 상태를 측정함으로써 서비스 품질을 평가할 수 있습니다.
- 고객의 웹 서비스 상태를 지속적으로 확인하기 위해 주기적인 헬스체크 기능이 제공되며, 장애가 발생할 경우 신속하게 대응할 수 있도록 알림 기능도 함께 지원됩니다.
- SLA 모니터링의 주요 특징으로는 오류 추적 및 복구 실행, 사용자 알림 기능, 직관적인 설정 방식이 포함되어 있습니다.
- 더불어, MTTR(평균 복구 시간), MTBF(평균 고장 간격), 중단 시간 및 발생 횟수와 같은 데이터를 보고할 수 있는 기능도 지원하여, 보다 체계적인 서비스 품질 관리가 가능합니다.
컨테이너 환경의 트러블 슈팅 및 장애 예측

- 컨테이너 환경에서는 장애 발생 시 빠른 원인 파악이 필수적입니다.
예를 들어, 웹 터미널에서 스레드 덤프를 받아 원인을 분석하려 했으나, 복사 과정 중 컨테이너가 재기동되면서 정보가 사라지는 상황이 발생할 수 있습니다. - 또한, 메모리 부족으로 서버가 주기적으로 재기동되는 경우, 원인을 파악하고 문제를 해결하기 위한 심층 분석이 필요합니다.
- 장애 예측은 머신러닝 기반으로 이루어지며, 관리자가 설정한 임계값에 도달할 것으로 예상될 때 사전 알림 이벤트를 제공하여 문제를 예방할 수 있도록 돕습니다.
- 실시간 머신러닝 통계 분석을 통해 JVM Heap 사용량의 증감을 분석하고, GC(가비지 컬렉션) 임계값을 초과할 시점을 예측하여 관리자가 즉각 대응할 수 있도록 정보를 제공합니다.
- 또한, 통계 분석을 기반으로 한 추세선 활성화 기능을 통해 더 정밀하고 정확한 장애 예측이 가능해져, 서비스 안정성을 한층 더 강화할 수 있습니다.
MSA 환경을 위한 애플리케이션 모니터링의 전략

- MSA 토폴로지 모니터링
마이크로서비스 간의 복잡한 연결 관계와 서비스 흐름을 실시간으로 시각화하여, 장애 발생 시 원인을 빠르게 추적할 수 있습니다. - SLA 모니터링
서비스 레벨 목표 (SLO)를 기반으로 각 서비스의 응답 시간, 가용성, 처리량을 측정하고, SLA 준수 여부를 실시간으로 확인합니다. - 트러블슈팅 / 장애 예측
로그, 메트릭, 트레이스 데이터를 기반으로 이상 징후를 감지하고, AI 기반 장애 예측 및 원인 분석을 통해 문제를 사전에 예방합니다. - 동시 자원 확장 (Auto Scaling)
트래픽 변화에 따라 자동으로 리소스를 확장/축소하여 서비스 성능을 유지하고 비용을 최적화합니다.
마무리
- 문의사항 : hello@msap.ai / 02-6953-5427