文章目录
Prometheus
Prometheus是最初在SoundCloud上构建的开源系统监视和警报工具包 。自2012年成立以来,许多公司和组织都采用了Prometheus,该项目拥有非常活跃的开发人员和用户社区。现在,它是一个独立的开源项目,并且独立于任何公司进行维护。为了强调这一点并阐明项目的治理结构,Prometheus在2016年加入了 Cloud Native Computing Foundation,这是继Kubernetes之后的第二个托管项目。
功能
主要特点:
- 一个多维数据模型,其中包含通过(metric)指标名称和键/值对标识的时间序列数据
- PromQL,一种灵活的查询语言
- 不依赖分布式存储;单服务器节点是自治的
- 基于HTTP通过模型拉取进行时间序列收集
- 通过中间网关支持推送时间序列
- 通过服务发现或静态配置发现目标
- 支持多种图形和仪表板模式
组件
Prometheus生态系统包含多个组件,其中许多是可选的:
- Prometheus主服务器,它会获取并存储时间序列数据
- client libraries,用于检测应用程序代码
- 一个支持短期任务的推送网关
- 诸如HAProxy,StatsD,Graphite等服务的专用exporters
- 处理警报的alertmanager
- 各种支持工具
架构
Prometheus直接或通过中间推送网关从已检测作业中获取指标,以用于短期作业。它在本地存储所有获取的样本,并对这些数据运行rules,以汇总和记录现有数据中的新时间序列,或生成警报。Grafana或其他API使用者可以用来可视化收集的数据。
使用场景
Prometheus可以很好地记录任何纯数字时间序列。它既适合以机器为中心的监视,也适合监视高度动态的面向服务的体系结构。在微服务世界中,其对多维数据收集和查询的支持是一种特别的优势。
Prometheus是为可靠性而设计的系统,在中断期间,可以让您快速诊断问题。每个Prometheus服务器都是独立的,而不依赖于网络存储或其他远程服务。当基础结构的其他部分损坏时,你也可以使用它。并且无需设置大量的基础结构就能使用。
Prometheus重视可靠性。即使在故障情况下,您始终可以查看有关系统的可用统计信息。如果您需要100%的准确性(例如按请求计费),则Prometheus并不是一个好的选择,因为所收集的数据可能不会足够详细和完整。在这种情况下,最好使用其他系统来收集和分析计费数据,并使用Prometheus进行其余的监视。