Grafana OnCall
Тема дорожной карты · Grafana
Grafana OnCall — платформа дежурств с открытым исходным кодом, разработанная Grafana Labs: она интегрируется с Grafana Alerting и охватывает полный жизненный цикл уведомлений об инцидентах — политики эскалации, расписания дежурств, интеграции пейджинга и группировку алертов — в едином интерфейсе. Изначально приобретённая у Amixr, Grafana OnCall может развёртываться как self-hosted сервис на Docker или Kubernetes рядом с Grafana, либо использоваться как управляемый сервис в Grafana Cloud; она подключается к Grafana через плагин Grafana OnCall, устанавливаемый через Administration > Plugins. Когда срабатывает алерт Grafana, Grafana OnCall маршрутизирует уведомление через настраиваемые цепочки эскалации, которые могут оповещать дежурного инженера по телефону, SMS, через Slack, PagerDuty или другие интеграции, автоматически соблюдая текущее расписание дежурств. Grafana OnCall обеспечивает управление расписаниями с поддержкой ротации, возможностью временной замены при плановых отсутствиях и календарём смен дежурства, позволяющим сразу видеть, кто в данный момент несёт ответственность. Группировка алертов и рабочий процесс подтверждения/разрешения в Grafana OnCall снижают усталость от алертов, объединяя связанные алерты из одного источника Grafana Alerting в единый инцидент, который дежурные инженеры отслеживают до его разрешения.
Как это работает
Grafana OnCall: panel plugins (новые типы визуализации), datasource plugins (новые backend), app plugins (пакет дашбордов + datasources + панелей — например AWS App). Установка через grafana-cli plugins install <name>, Helm values или ручную загрузку. Много плагинов community-maintained — аудитьте до добавления (signed-plugins рекомендуются в production). Стройте кастомные плагины через Grafana plugin SDK (TypeScript + React).
Когда применять
Только signed, официальные плагины в production. Pie chart, Worldmap и т.д. из официального каталога. Кастомные плагины — только когда нет существующего (маленькая dev-инвестиция ок; поддерживать плагин — реальная работа). Аудит установленных плагинов раз в квартал — неиспользуемые добавляют поверхность атаки.
Типичные ошибки
Ловушки Grafana OnCall: установка unsigned community-плагинов, которые забрасываются (security + функциональный риск); несовместимость версии плагина с версией Grafana (читайте compatibility matrix); сборка кастомного плагина под одноразовый кейс (живёт вечно как maintenance-нагрузка).