新功能：Prometheus Agent 模式上手体验

最新推荐文章于 2025-02-13 00:15:00 发布

张晋涛-MoeLove

最新推荐文章于 2025-02-13 00:15:00 发布

阅读量1.9k

点赞数

文章标签： java 大数据 docker 数据库分布式

本文链接：https://blog.csdn.net/tao12345666333/article/details/121601317

版权

本文介绍了Prometheus Agent模式的上手体验，包括拉模式和推模式的对比，Prometheus的HA、持久化和集群方案。重点讲述了Prometheus Agent如何通过远程写入到Thanos进行数据聚合，提供了启用Agent模式的步骤和配置，以及查询数据的流程。该模式适用于Prometheus的高可用、数据持久化和集群场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

大家好，我是张晋涛。

Prometheus 几乎已经成为了云原生时代下监控选型的事实标准，它也是第二个从 CNCF 毕业的项目。

当前，Prometheus 几乎可以满足各种场景/服务的监控需求。我之前有写过一些文章介绍过 Prometheus 及其生态，本篇我们将聚焦于 Prometheus 最新版本中发布的 Agent 模式，对于与此主题无关的一些概念或者用法，我会粗略带过。

拉模式（Pull）和推模式（Push）

众所周知，Prometheus 是一种拉模式（Pull）的监控系统，这不同于传统的基于推模式（Push）的监控系统。

什么是拉模式（Pull）呢？

Prometheus Pull model

待监控的服务自身或者通过一些 exporter 暴露出来一些 metrics 指标的接口，由 Prometheus 去主动的定时进行抓取/采集，这就是拉模式（Pull）。即由监控系统主动的去拉（Pull）目标的 metrics。

与之相对应的就是推模式（Push）了。

Monitor Push model

由应用程序主动将自身的一些 metrics 指标进行上报，监控系统再进行相对应的处理。如果对于某些应用程序的监控想要使用推模式（Push），比如：不易实现 metrics 接口等原因，可以考虑使用 Pushgateway 来完成。

对于拉模式（Pull）和推模式（Push）到底哪种更好的讨论一直都在继续，有兴趣的小伙伴可以自行搜索下。

这里主要是聚焦于单个 Prometheus 和应用服务之间交互的手方式。本篇我们从更上层的角度或者全局角度来看看当前 Prometheus 是如何做 HA、持久化和集群的。

Prometheus HA/持久化/集群的方案

在大规模生产环境中使用时，很少有系统中仅有一个单实例 Prometheus 存在的情况出现。无论从高可用、数据持久化还是从为用户提供更易用的全局视图来考虑，运行多个 Prometheus 实例的情况就很常见了。

目前 Prometheus 主要有三种办法来将多个 Prometheus 实例的数据进行聚合，并给用户提供一个统一的全局视图。

联邦（Federation）：是最早期的 Prometheus 内置的数据聚合方案。这种方案下，可以使用某个中心 Prometheus 实例从叶子 Prometheus 实例上进行指标的抓取。这种方案下可以保留 metrics 原本的时间戳，整体也比较简单；
Prometheus Remote Read（远程读）：可以支持从远程的存储中读取原始 metrics，注意：这里的远程存储可以有多种选择。当读取完数据后，便可对它们进行聚合，并展现给用户了；
Prometheus Remote Write（远程写）：可以支持将 Prometheus 采集到 metrics 等写到远程存储中。用户在使用的时候，直接从远端存储中读取数据，并提供全局视图等；