SLO (Service Level Objective)
Service Level Objective (SLO) — это цель уровня обслуживания, которая определяет ожидаемую производительность сервиса с точки зрения пользователя.
Основные характеристики SLO
- Измеримые метрики качества сервиса
- Внутренние цели команды
- Основа для принятия решений о релизах
- Баланс между надежностью и скоростью разработки
Примеры SLO
- Доступность: 99.9% времени безотказной работы
- Латентность: 95% запросов обрабатываются менее чем за 100мс
- Пропускная способность: система обрабатывает 1000 RPS
- Качество: менее 0.01% запросов возвращают ошибки
Как определить SLO
- Определите SLI (Service Level Indicators)
- Соберите базовую статистику производительности
- Установите реалистичные цели
- Регулярно пересматривайте и корректируйте
Бюджет ошибок
Бюджет ошибок = 100% - SLO. Если SLO составляет 99.9%, то бюджет ошибок — 0.1%.
FAQ
Что делать, если SLO нарушается?
При нарушении SLO приоритет смещается с новых функций на улучшение надежности системы.