Распределенная трассировка — это методика, используемая для мониторинга и отладки приложений, которые состоят из множества микросервисов. Она позволяет отслеживать выполнение запросов, которые проходят через множество сервисов, предоставляя разработчикам понимание того, как запросы обрабатываются в сложной распределенной системе. Распределенная трассировка собирает данные по мере прохождения запросов от одного сервиса к другому, записывая каждый сегмент пути в виде span'а. Эти span'ы содержат важные детали о каждом этапе запроса и объединяются в одну трассировку. Завершенная трассировка дает представление обо всем запросе.
Медленная трассировка и распределенная трассировка отличаются по своей природе. Медленная трассировка обычно используется для анализа проблем, связанных с производительностью приложений. Она позволяет отслеживать каждый шаг выполнения запроса и определять, какие части приложения работают медленно. Можно найти на дэшборде здоровья приложения.
Распределенная трассировка, с другой стороны, используется для анализа проблем, связанных с работой всей системы в целом. Она позволяет отслеживать путь запроса через различные компоненты системы, такие как серверы, приложения и сети. Это помогает определить, какие компоненты системы вызывают задержки или проблемы в работе.
В распределенную трассировку вы сможете перейти с домашней страницы сервисов, там сверху ест меню с переходом на дэшборд Traces. Нажимая на него, вы попадаете Home > Dashboards > main > Distributed tracing Используйте фильтр, чтобы найти интересующую вас транзакцию и посмотрите содержание ошибок и статистику по ней. По меткам времени вы можете просмотреть транзакцию, отфильтровать спаны (участки трассировки) и просмотреть подробную информацию в Service & Operation.
Если вы хотите устранить ошибки в транзакции, которая охватывает множество сервисов:
- Откройте страницу пользовательского интерфейса распределенной трассировки.
- Отсортируйте трейсы с помощью фильтра, чтобы найти конкретный запрос и показать только трейсы, содержащие ошибки.
- На странице подробностей трассировки просмотрите участок маршрута запроса, на котором возникла ошибка.
- Обратив внимание на тип ошибки и сообщение, перейдите к службе из ее участка в трассировки (span'а), чтобы увидеть, что ошибка возникает с большой частотой. На уровне спанов мы можем посмотреть, где в процессе возникли ошибки, как они разрастались и где были обработаны. Каждый участок, который заканчивается ошибкой, отображается в пользовательском интерфейсе и вносит вклад в общее количество ошибок для этой трассировки.