Contact points

Тема дорожной карты · Grafana

Точки доставки в Grafana Alerting определяют, куда и каким образом доставляются уведомления об алертах при их срабатывании: поддерживается широкий спектр интеграций — электронная почта, Slack, PagerDuty, OpsGenie, Microsoft Teams, Telegram, вебхуки и другие. Одна точка доставки может содержать несколько каналов уведомления (например, одновременно электронную почту и Slack), так что критический алерт одновременно достигает нескольких каналов без дублирования конфигурации политики уведомлений. Точки доставки настраиваются в Alerting > Contact points интерфейса Grafana: выбирается тип канала, вводятся необходимые учётные данные (например, URL вебхука Slack или настройки SMTP) и при желании настраивается шаблон сообщения с использованием синтаксиса шаблонов Go для включения нужных меток и аннотаций алерта. Grafana поставляется с шаблонами сообщений по умолчанию для каждого типа канала, но пользовательские шаблоны с {{ .Labels.instance }} или {{ .Annotations.summary }} позволяют командам адаптировать содержание уведомлений к своему процессу дежурств. Точки доставки можно тестировать прямо со страницы конфигурации кнопкой Test, которая отправляет тестовое уведомление для проверки доставки до того, как точка доставки будет назначена действующей политике уведомлений.

Как это работает

Contact points (unified alerting с Grafana 9) позволяет определять alert rules с PromQL/LogQL/SQL-запросами + периодически оценивать + роутить к contact points. Rules в папках; папки наследуют notification policies. Notification channels: Slack, PagerDuty, OpsGenie, Telegram, email, webhook, MS Teams. Состояния алертов: Normal, Pending (условие выполнено, но ещё не дошло до "for"-длительности), Firing.

Когда применять

Grafana alerting — если хотите алерты, охватывающие несколько datasources (одно правило, комбинирующее Prometheus + Loki — полезно для SLO с errors + latency). Prometheus + Alertmanager напрямую — если хотите single PromQL/Alertmanager-стек. Выберите один и держитесь его; гонять оба создаёт путаницу дублирования правил.

Типичные ошибки

Ловушки Contact points: алерты без "for:"-длительности (flapping); имена алертов без контекста (HighCPU — на чём? когда?); нет runbook-ссылки в annotations; все алерты в один Slack-канал (alert fatigue — роутьте по severity).

Связанные понятия

Полезные ресурсы