Receivers
Тема дорожной карты · Prometheus
Получатели (receivers) в Alertmanager — это конечные точки уведомлений, на которые отправляются оповещения после их маршрутизации. Они настраиваются в разделе receivers файла конфигурации alertmanager.yml. Получатели могут включать различные интеграции, такие как email_configs, slack_configs, pagerduty_configs или webhook_configs. Один получатель может объединять несколько каналов уведомлений, что позволяет одновременно отправлять оповещения по электронной почте и в канал Slack. Получатели referenced по имени в дереве маршрутизации, что позволяет направлять оповещения к соответствующим командам или системам дежурства. Правильная настройка получателей Alertmanager гарантирует, что оповещения Prometheus достигают нужных людей через правильные каналы без информационного шума.
Как это работает
Alertmanager принимает алерты из Prometheus и выполняет серию операций по их обработке. Он дедуплицирует алерты, чтобы избежать повторного уведомления о том же событии, группирует алерты по схожим метрикам и метаданным, а затем роутит их к соответствующим получателям. Получатели могут быть настроены для отправки уведомлений на различные платформы, такие как PagerDuty, Slack, электронная почта, Telegram или webhooks. Концепции, которые играют ключевую роль в этом процессе, включают alert rules, routing tree, silences и inhibition.
Когда применять
Алертите на симптомы, такие как latency, error rate или SLO burn, а не на причины, такие как CPU usage или RAM. Используйте параметр for: 5m (или более длительное время) для предотвращения ложных срабатываний алертов на всплески. Используйте severity labels, такие как severity: page или severity: ticket, для разного роутинга алертов. Каждый алерт должен иметь аннотацию runbook_url, чтобы указать действия, которые следует предпринять при срабатывании определенного алерта.
Типичные ошибки
Типичные ошибки при использовании получателей включают alert fatigue (слишком много низкоприоритетных оповещений, которые могут привести к игнорированию реальных проблем), алерты без runbooks (просто "X плохо" без указания конкретных действий), flapping-алерты (нет порога for:, условие осциллирует), и отсутствие Alertmanager-избыточности (одно точка отказа для отправки оповещений).