Retention политика

Тема дорожной карты · Prometheus

Политика хранения Prometheus контролирует, как долго данные метрик хранятся в локальной TSDB до автоматического удаления, обеспечивая баланс между ёмкостью хранилища и доступностью исторических данных. Период хранения по умолчанию составляет 15 дней и может быть изменён флагом запуска --storage.tsdb.retention.time, принимающим значения вида 30d, 6h или 1y. В качестве альтернативы хранение можно ограничить по размеру с помощью флага --storage.tsdb.retention.size, что приводит к удалению Prometheus самых старых блоков TSDB при превышении суммарным размером каталога данных заданного лимита (например, 50GB). Если заданы оба флага — по времени и по размеру — Prometheus применяет ограничение, достигаемое первым. Для сценариев, требующих более длительного хранения сверх ёмкости локального диска, Prometheus поддерживает remote_write во внешние системы — такие как Thanos или Cortex/Mimir — обеспечивающие долгосрочное хранение с объектным хранилищем в качестве бэкенда.

Как это работает

Retention политика — локальная TSDB по дефолту: chunks на диске, compaction в фоне, без кластеризации. Retention по времени (--storage.tsdb.retention.time) или размеру (--storage.tsdb.retention.size). Для long-term + clustered: Thanos (sidecar + object store), Cortex / Mimir (multi-tenant, горизонтальный), VictoriaMetrics (drop-in совместимый, часто проще эксплуатировать). Remote write/read API позволяет Prometheus push samples во внешние системы.

Когда применять

Для < 1 года данных + < ~1M samples/sec локальный Prometheus достаточен. За пределами: VictoriaMetrics — простейший scale-up путь (лучше сжатие, быстрее, меньше движущихся частей, чем Thanos). Thanos/Mimir — если нужна object-storage-долговечность + multi-cluster federation. Планируйте retention vs cardinality — высокая cardinality + долгий retention = дорого.

Типичные ошибки

Ловушки Retention политика: ротация persistent-volume Prometheus + потеря всех данных; расчёт federation = HA (это read-агрегация, не репликация); высокая write rate без SSD I/O (TSDB-writes I/O-тяжёлые); миграция на Thanos без понимания операционной сложности (много движущихся частей).

Связанные понятия

Полезные ресурсы