SLO (Service Level Objectives) позволяют задать целевой уровень качества сервиса и отслеживать его выполнение. Система рассчитывает текущий SLI, оставшийся error budget и скорость его сгорания (burn rate), а также создаёт алерты при превышении допустимого отклонения.
Пользователь задаёт целевой показатель (например, «99% запросов без ошибок за 7 дней»). Система непрерывно рассчитывает SLI по скользящему окну, вычисляет error budget и burn rate, визуализирует их на дашборде и создаёт алерты по модели Google SRE (fast burn / slow burn).
- Создание SLO — из шаблона или вручную, три способа определения SLI: отношение количественных метрик, SQL условие, произвольный запрос
- Библиотека стандартных SLO — готовые шаблоны для APM, браузерного мониторинга и инфраструктуры
- Дашборд SLO — текущий SLI, error budget, burn rate, графики событий и метрик
- Автоматические алерты по модели Google SRE (fast burn / slow burn)
- Копирование и удаление SLO
- Оценка влияния инцидента на SLO
- Оценка стоимости нарушения SLO — связь с бизнес-метриками и пересчёт потерь error budget в деньги
- Использование — пошаговые инструкции по работе с SLO