Skip to content

Latest commit

 

History

History
24 lines (15 loc) · 2.23 KB

File metadata and controls

24 lines (15 loc) · 2.23 KB

SLO

SLO (Service Level Objectives) позволяют задать целевой уровень качества сервиса и отслеживать его выполнение. Система рассчитывает текущий SLI, оставшийся error budget и скорость его сгорания (burn rate), а также создаёт алерты при превышении допустимого отклонения.

Как это работает

Пользователь задаёт целевой показатель (например, «99% запросов без ошибок за 7 дней»). Система непрерывно рассчитывает SLI по скользящему окну, вычисляет error budget и burn rate, визуализирует их на дашборде и создаёт алерты по модели Google SRE (fast burn / slow burn).

Возможности

  • Создание SLO — из шаблона или вручную, три способа определения SLI: отношение количественных метрик, SQL условие, произвольный запрос
  • Библиотека стандартных SLO — готовые шаблоны для APM, браузерного мониторинга и инфраструктуры
  • Дашборд SLO — текущий SLI, error budget, burn rate, графики событий и метрик
  • Автоматические алерты по модели Google SRE (fast burn / slow burn)
  • Копирование и удаление SLO

Планируемые возможности

  • Оценка влияния инцидента на SLO
  • Оценка стоимости нарушения SLO — связь с бизнес-метриками и пересчёт потерь error budget в деньги

Далее