
SLA SLO SLISLA / SLO / SLI
SLA, SLO, SLI는 서비스 신뢰성을 측정하고 약속하는 계층적 프레임워크다. 구글의 SRE(Site Reliability Engineering)에서 체계화됐으며, 서비스 운영의 표준 지표로 자리잡았다.
개념 계층
SLI (Service Level Indicator)
실제로 측정 가능한 서비스 품질 지표.
SLO (Service Level Objective)
SLI에 대한 내부 목표값. SLA보다 엄격하게 설정.
에러 버짓 (Error Budget)
SLO를 지키면서 허용되는 오류의 총량.
SLA vs SLO 관계
SLA는 고객과의 계약으로 법적 효력이 있다. SLO를 SLA보다 10~20% 엄격하게 설정해 완충.
| 항목 | SLO (내부 목표) | SLA (계약) |
|---|---|---|
| 가용성 | 99.95% | 99.9% |
| 레이턴시 | 150ms | 200ms |
| 위반 시 | 알람, 인시던트 | 환불, 패널티 |
관련 개념
- •관찰가능성 — SLI 측정을 위한 기반
- •Prometheus — SLI 메트릭 수집
- •부하 테스트 — SLO 달성 가능성 검증
- •서킷 브레이커 — SLO 보호 패턴