Skip to content

Latest commit

 

History

History
142 lines (83 loc) · 9.88 KB

File metadata and controls

142 lines (83 loc) · 9.88 KB

MCP — Использование

После подключения MCP-сервера к AI-агенту общение идёт на естественном языке — агент сам выбирает инструмент по формулировке вопроса. Ниже — типовые задачи и примеры того, как их спросить.

Окно времени для большинства запросов по умолчанию — 60 минут. Чтобы посмотреть другой интервал, просто упомяните его в вопросе: «за последний час», «за 6 часов», «за сутки». Агент понимает русский и английский.

Состояние приложений

Список APM-приложений и их текущий Apdex.

Примеры формулировок:

  • «Какой Apdex у моих приложений?»
  • «Покажи список приложений и их состояние»
  • «Apdex приложений за последние 6 часов»

В ответ — список приложений от худшего Apdex к лучшему: имя, язык агента, Apdex (от 0 до 1).

Шкала Apdex:

Apdex Состояние
≥ 0.94 отлично
0.85 – 0.93 хорошо
0.7 – 0.84 средне
0.5 – 0.69 плохо
< 0.5 неприемлемо

Проблемные приложения

Только то, чему сейчас плохо — с временем ответа, нагрузкой и долей ошибок.

Примеры формулировок:

  • «Каким приложениям сейчас плохо?»
  • «Покажи приложения с деградацией»
  • «Какие приложения чувствуют себя хуже всего?»

По умолчанию агент берёт приложения с Apdex ниже 0.7 («плохо» и «неприемлемо»). Порог сдвигается уточнением:

  • «Только критичные» — порог 0.5
  • «Всё, что не в порядке» — порог 0.85
  • «Все приложения с метриками» — порог 1.0

Для каждого приложения вернутся: язык, имя, Apdex, среднее время ответа (resp, секунды), частота запросов (rpm, в минуту), доля ошибок (errors, 0..1). Сортировка — от худшего к лучшему.

Состояние конкретного приложения

Подробный статус одного приложения по имени — удобно, когда уже понятно, на что смотреть.

Примеры формулировок:

  • «Как себя чувствует web-api?»
  • «Покажи здоровье transaction-services за последний час»
  • «Что с api-gateway?»

Имя приложения берётся как есть, регистр символов важенWeb-API и web-api для GMONIT разные приложения. Если не уверены в точном имени, сначала запросите список, а потом проваливайтесь в конкретное.

В ответ — те же метрики, что и для проблемных приложений: язык, имя, Apdex, время ответа, RPM, доля ошибок.

Если такого приложения нет или у него нет данных в выбранном окне — агент сообщит и предложит проверить имя или расширить окно.

Здоровье системы

Быстрая диагностика самого GMONIT — диски ClickHouse, ошибки запросов, идёт ли загрузка данных.

Примеры формулировок:

  • «Проверь здоровье GMONIT»
  • «Что с инфраструктурой ClickHouse?»
  • «Покажи ошибки за последний час»

В ответ агент соберёт три блока:

  • Диски ClickHouse — занятое и свободное место по томам, процент свободного
  • Недавние ошибки запросов — сгруппированные исключения с числом срабатываний и временем последнего
  • Активность загрузки данных — таблицы, в которые шли INSERT, с количеством запросов, строк и объёмом за окно. Если тут пусто — pipeline ничего не пишет, это повод копать

Окно по умолчанию для ошибок — 30 минут (меняется уточнением в вопросе).

С этого запроса удобно начинать, если подозрение на проблему со сбором или хранением данных.

Схема данных

Список таблиц ClickHouse и их структура — подготовка к произвольному SQL или просто, чтобы понять, где что лежит.

Найти таблицы:

  • «Покажи все таблицы»
  • «Какие таблицы с метриками есть в базе?»
  • «Найди таблицы по шаблону %browser%»

В ответ — список с движком ClickHouse, числом строк, размером и ключами сортировки. Сортировка — самые большие первыми.

Описать конкретную таблицу:

  • «Какие колонки в nr_metric_data_by_name_by_minute_v2
  • «Покажи структуру nr_error_event_data»

В ответ — полный CREATE TABLE: колонки и их типы, движок, ключи, TTL.

Эти вопросы обычно идут перед произвольным SQL — чтобы агент сразу знал точные имена колонок и не угадывал.

Произвольный SQL

SQL-запрос к ClickHouse, который агент пишет сам по формулировке.

Доступно только при включённом режиме произвольного SQL.

Примеры формулировок:

  • «Сколько уникальных хостов отправляет данные в nr_metric_data_by_name_by_minute_v2 за последний час?»
  • «Топ-10 приложений по числу запросов за сутки»
  • «Сколько ошибок по web-api за день, сгруппированных по типу?»

Агент сам напишет SQL, опираясь на вопрос и схему. Результат режется до 200 строк — если данных больше, агент покажет первые 200 и сообщит общее количество.

Если режим на коллекторе не включён, агент в ответ получит строку execute_query is disabled on this Collector и сообщит вам — никакого скрытого падения. Как включить — см. настройку.