APM 에 대한 FAQ 5가지
안녕하세요.
오픈나루 기업부설연구소 이지애 대리입니다.
이번 포스팅 주제는 OPENMARU APM 을 사용하시는 고객 분들께서 가장 많이 궁금하시는 아래의 5가지 질문들에 대한 답변을 준비하였습니다.
다음에서 고객님들께서 가장 많이 문의 주시는 5가지 질문들을 보겠습니다.
- OPENMARU APM 수집서버 설치 시 시스템의 권장 사양이 어떻게 될까요?
- APM 에서 CPU/ Memory / Disk 와 같은 OS 자원 모니터링은 지원하나요?
- APM 서버의 데이터 저장 주기는 얼마나 될까요? 1년 또는 1개월?
- 애플리케이션 별로 접속권한이나 메뉴등을 설정할 수 있을까요?
- APM 에서 시스템 장애 시 이벤트를 이메일나 문자로 알려 줄 수 있나요?
1. APM 수집 서버는 어느 정도 사양이 필요한가요?
[질문] OPENMARU APM 수집서버 설치 시 시스템의 권장 사양이 어떻게 될까요?
OPENMARU APM Server 설치 지원 환경에 대해 알아보겠습니다.
OPENMARU APM Server는 다음과 같은 운영체제 환경에 OPENMARU Installer를 사용하여 설치할 수 있습니다.
OPENMARU APM 설치 확인 사항
-
별도의 서버가 필요합니다. (권장하는 사양은 8 Core, MEM 16G, Disk 500G 입니다.)
-
OS는 CentOS 혹은 RHEL 이 필요합니다. ( 6, 7 64bit 버전이 가능합니다. 가능하면 최신 버전이 좋습니다.)
-
Yum Repository 설정이 필요합니다. (ISO 이미지를 직접 준비해야 하는지 확인이 필요합니다.)
-
해당 서버의 root 권한이 필요합니다. (최소 sudo 권한이라도 필요합니다.)
-
해당 서버의 IP 정보가 필요합니다. (라이선스 발급 용도)
-
별도 방화벽 확인 필요 (하단)
-
OPENMARU APM 수집 서버의 사양은 다음과 같습니다.
|
CPU |
Memory |
Disk |
Agent |
---|---|---|---|---|
권장사양 |
8 core |
16 GB |
500 GB |
50 EA |
추천사양 |
16 core |
16 GB |
1 TB |
100 EA |
-
OPENMARU APM 수집 서버의 사양은 다음과 같습니다. (컨테이너 환경)
|
CPU |
Memory |
Disk |
Agent |
---|---|---|---|---|
권장사양 |
16 core |
16 GB |
1 TB |
100 EA |
- Agent 항목은 모니터링 대상 서비스의 권장 개수입니다.
- OS 파티션외에 별도 데이터 저장 파티션으로 준비해주시면 됩니다.
- Agent 갯수가 50개 이상이거나 OpenShift(Kubernetes)와 같은 PaaS 환경에서는 SSD 디스크를 권장합니다.
2. APM 에서 시스템 모니터링도 가능한가요?
[질문] CPU/ Memory / Disk 와 같은 OS 자원 모니터링은 어떻게 지원하는 걸까요?
CPU, Memory, Disk 모니터링은 OPENMARU APM System 대시보드에서 확인하실 수 있습니다.
System Agent가 수집하는 많은 데이터 중에서 시스템에 발생할 수 있는 문제를 한눈에 파악할 수 있도록 대시보드를 구성하여 제공합니다.
하단에 해당 색깔로 CPU 사용률, 메모리 사용률, Root 파티션 사용률을 표시했습니다.
3. APM 에서 데이터 저장 기간은 어떻게 되나요?
[질문] APM 서버의 데이터 저장 주기는 얼마나 될까요? 1년 또는 1개월?
데이터 주기는 T-Map 최대 30일 , Chart 최대 100일로 지정할 수가 있습니다.
설정 방법은 홈 / 설정 / 시스템 설정 – Transaction days to keep / Chart days to keep 에서 하실 수 있습니다.
조회 날짜가 있을 때는 History를 선택하여 원하는 날짜를 지정하면 해당 날짜의 T-Map 상황을 조회할 수 있고,
원하는 기간으로 조회하고 싶은 경우에는 Range를 선택하여 원하는 시작 날짜와 시간부터 끝 날짜의 시간까지의 범위에 해당하는 T-Map 상황을 조회할 수 있습니다.
4. APM 에서 애플리케이션 별로 접속 아이디를 분리할 수 있나요?
[질문] 애플리케이션 별로 접속권한이나 메뉴등을 설정할 수 있을까요?
설정 – 애플리케이션 그룹 관리 – 애플리케이션 목록 화면입니다.
애플리케이션 그룹관리는 클러스터링된 인스턴스 그룹 리스트를 관리합니다.
애플리케이션 그룹 리스트를 아래와 같이 확인할 수가 있습니다.
애플리케이션 목록 창에서 추가 버튼을 누르고 애플리케이션 이름을 설정해 줍니다.
애플리케이션을 추가하여 인스턴스 ID를 추가하는 것을 보여드리겠습니다.
필요에 따라서 애플리케이션 목록 – Enable 버튼을 통해 애플리케이션을 활성화 / 비활성화 시킬 수 있으며 특정 인스턴스도 활성화 / 비활성화 시킬 수 있습니다.
Enable 버튼을 클릭하면 Show / Hide로 표시가 됩니다.
Enable 버튼을 클릭만 하면 쉽게 활성화 / 비활성화 시킬 수 있습니다.
5. APM 에서 장애시 문자나 이메일로 알려줄 수 있나요?
[질문] APM 에서 시스템 장애시 이벤트와 장애 임계치 에 대해 이메일나 문자로 알려 줄 수 있을까요?
마지막으로 이벤트 경고 정책 변경 방법에 대해 알아보겠습니다.
모니터링 대상 WAS, 시스템의 데이터의 통계 정보를 기반으로 운영자에 경고를 알리기 위한 정책 설정 및 발생한 이벤트들을 확인할 수 있는 메뉴입니다.
경고 이벤트가 매 항목마다 발생하게 되면 너무 많은 이벤트가 발생할 가능성이 높으므로
정말 문제가 될 가능성이 있을 때만 경고 이벤트가 발생할 수 있도록 실시간 통계를 기준으로 이벤트가 발생하도록 합니다.
경고 정책 설정에서 WAS 인스턴스 별, Web 서버, 시스템의 경고 정책 등을 설정할 수 있습니다.
WAS 인스턴스 경고 항목으로는 아래와 같습니다.
항목 |
설명 |
---|---|
JVM Heap 사용률 |
JVM 의 Heap 사용률로 설정 |
JVM Perm 사용률 |
JVM 의 Perm 영역 사용률로 설정 |
사용자 만족도지수(APDEX) |
사용자 만족도 지수(APDEX)를 기준으로 경고(Warning), 심각(Critial) 레벨 설정 |
오류율 |
애플리케이션의 상태 코드로 판단한 오류율로 설정한다. |
데이터베이스 쿼리 평균 응답시간 |
데이터베이스 쿼리의 평균 응답시간을 기준으로 설정 |
Pending Transactions |
처리 되지 못한 트랜잭션 개수 |
GC 시간 비율 |
전체 시간 중 GC 에 소요되는 시간의 비율로 설정 |
Error Transaction |
에러가 발생한 트랜잭션 |
다음은 WEB 서버 인스턴스 경고 항목입니다.
항목 |
설명 |
---|---|
WEB Traffic |
웹서버가 처리하는 트래픽의 Byte 량 |
Worker Usage |
Worker의 Thread 사용량 |
다음은 시스템 경고 항목입니다.
항목 |
설명 |
---|---|
CPU 사용률 |
시스템의 CPU 사용률을 기준으로 설정 |
메모리 사용률 |
시스템의 메모리 사용률을 기준으로 설정 |
Swap 메모리 사용률 |
시스템의 Swap 메모리 사용률을 기준으로 설정 |
디스크 사용률 |
시스템 디스크 사용률을 기준으로 설정 |
네트워크 패킷 오류율 |
네트워크 패킷의 오류율을 기준으로 설정 |
설정 항목에 대해 알아보겠습니다.
항목 |
설명 |
---|---|
Warn, Critical 값을 설정하는 Slider |
해당 항목에 대한 경고(Warning), 심각(Critical)값을 설정 |
Activate This Alert |
해당 경고 항목을 사용할 것인지를 결정 |
Warning Threshold |
설정한 시간 동안의 데이터 평균값이 설정한 Warning 값을 넘어서면 경고 이벤트를 발생한다. |
Critical Threshold |
설정한 시간 동안의 데이터 평균값이 설정한 Critial 값을 넘어서면 경고 이벤트를 발생한다. 일반적으로 Critical 을 판별하는 시간은 Warning 보다 작은 값으로 설정한다 |
Alerts to |
어떤 사용자에게 이벤트를 발생시킬지를 지정 |
Alerts via |
메일을 통해서 이벤트를 알릴지를 설정 |
마지막으로 직접 JVM Heap 사용률의 경고 정책을 설정해 보겠습니다.
APM 설치 시 기본값으로 경고 정책이 설정되지만 사용자가 원하는 값으로 바꿀 수가 있습니다.
JVM Heap Usage의 Warning 경고 정책을 기존 80%에서 20%로 바꾸어 보았습니다.
Critical은 60%로 되었습니다.
마무리
이번 시간을 통해 엔지니어들의 FAQ 5가지에 대한 해답을 제공함으로써
오픈마루 APM이 사용자들에게 쾌적하게 서비스가 제공되고 있는지를 가용성과 성능의 관점에서 분석하여 정보들을 제공하는 것을 함께 보셨는데요!
사용자에게 최적화된 서비스라는 것을 다시 한 번 느낄 수 있었습니다.
오픈마루 APM과 함께 최적화된 서비스를 이용해 보시기 바랍니다!
이 글은 오픈나루 기업부설연구소 이지애 님이 작성해 주셨습니다.
Written by Jiae Lee ( jiae@opennaru.com )
APM 파헤치기 – OTT 서비스처럼 빠르고 끊김 없는 서비스, 그 뒤엔 APM이 있다?
/in APM, OPENMARU/by 오픈마루 마케팅3OPENMARU APM 활용 사례로 이해하는 쿠버네티스 모니터링
/in APM, Kubernetes, OPENMARU/by 오픈마루 마케팅2OPENMARU Sentry 파헤치기 – 공공 부문에서 효과적인 웹사이트 품질관리 방법은?
/in APM, OPENMARU/by 오픈마루 마케팅3