SLO (Service Level Objective)

Service Level Objective (SLO) — это цель уровня обслуживания, которая определяет ожидаемую производительность сервиса с точки зрения пользователя.

Основные характеристики SLO

  • Измеримые метрики качества сервиса
  • Внутренние цели команды
  • Основа для принятия решений о релизах
  • Баланс между надежностью и скоростью разработки

Примеры SLO

  • Доступность: 99.9% времени безотказной работы
  • Латентность: 95% запросов обрабатываются менее чем за 100мс
  • Пропускная способность: система обрабатывает 1000 RPS
  • Качество: менее 0.01% запросов возвращают ошибки

Как определить SLO

  1. Определите SLI (Service Level Indicators)
  2. Соберите базовую статистику производительности
  3. Установите реалистичные цели
  4. Регулярно пересматривайте и корректируйте

Бюджет ошибок

Бюджет ошибок = 100% - SLO. Если SLO составляет 99.9%, то бюджет ошибок — 0.1%.

FAQ

Что делать, если SLO нарушается?

При нарушении SLO приоритет смещается с новых функций на улучшение надежности системы.