本文是向大家介绍Prometheus监控的相关基本概念、部署和配置方法,能够帮助大家了解并使用Prometheus监控平台。
1、背景
公司技术全面建设容器化和Kubernetes化,需要有一定的工具和手段针对容器和Kubernetes进行监控,而Prometheus为容器、Kubernetes提供了监控采集、存储、计算、数据展示、报警等能力。
2、组件介绍
2.1、概述
Prometheus是一套开源的监控、报警、时间序列数据库的组合,起始是由SoundCloud公司开发的。从2016年加入CNCF,2016年6月正式发布1.0版本,2017年底发布了基于全新存储层的2.0版本,能更好地与容器平台、云平台配合,到2018年8月毕业,现在已经成为Kubernetes的官方监控方案,社区活跃,第三方集成非常丰富。
2.2、特点
Prometheus是一个开源的完整监控解决方案,其对传统监控系统的测试和告警模型进行了彻底的颠覆,形成了基于中央化的规则计算、统一分析和告警的新模型。 相比于传统监控系统Prometheus具有以下优点:
- 易于管理:只有一个单独的二进制文件,不存在任何的第三方依赖,采用Pull的方式拉取数据
- 强大的数据模型:每一条时间序列由指标名称(Metrics Name)以及一组标签(Labels)唯一标识
- 强大的查询语言PromQL:内置了一个强大的数据查询语言PromQL,可以实现多种查询、聚合
- 高性能:单实例可以处理数以百万的监控指标、每秒处理数十万的数据点
- 易扩展:支持sharding和联邦集群,实现多数据中心
- 易集成:支持多种语言的SDK进行应用程序数据埋点,社区有丰富插件
- 可视化:自带Prometheus UI,可以进行查询与展示,Grafana也完整支持Prometheus。
- 开放性:使用sdk采集的数据可以被其他监控系统使用,不一定非要用Prometheus
2.3、Prometheus架构
- Prometheus Server 负责从 Exporter 拉取和存储监控数据,并提供一套灵活的查询语言(PromQL)
Retrieval: 采样模块
TSDB: 存储模块默认本地存储为tsdb
HTTP Server: 提供http接口查询和面板,默认端口为9090
- Exporters/Jobs
负责收集目标对象(host, container…)的性能数据,并通过 HTTP 接口供 Prometheus Server 获取。支持数据库、硬件、消息中间件、存储系统、http服务器、jmx