💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。
本人主要分享计算机核心技术:系统维护、数据库、网络安全、自动化运维、容器技术、云计算、人工智能、运维开发、算法结构、物联网、JAVA 、Python、PHP、C、C++等。
不同类型针对性训练,提升逻辑思维,剑指大厂,非常期待和您一起在这个小小的网络世界里共同探索、学习和成长。
Prometheus Pushgateway 详解
一.Pushgateway 介绍
Pushgateway为Prometheus整体监控方案的功能组件之一,并做为一个独立的工具存在。它主要用于Prometheus无法直接拿到监控指标的场景,如监控源位于防火墙之后,Prometheus无法穿透防火墙;目标服务没有可抓取监控数据的端点等多种情况。在类似场景中,可通过部署Pushgateway的方式解决问题。当部署该组件后,监控源通过主动发送监控数据Pushgateway,再由Prometheus定时获取信息,实现资源的状态监控。
工作流程
- 监控源通过Post方式,发送数据到Pushgateway,路径为/metrics。
- Prometheus服务端设置任务,定时获取Pushgateway上面的监控指标。
- Prometheus获取监控指标后,会根据告警规则进行计算,如果匹配将触发告警到Alertmanager;同时,Grafana可配置数据源调用Prometheus数据,做为数据展示。
二.Pushgateway 优缺点介绍
Pushgateway优点
- Prometheus 默认采用定时pull 模式拉取targets数据,但是如果不在一个子网或者防火墙,prometheus就拉取不到targets数据(普罗米修斯和target不在一个网段,那么是拉取不到的),所以可以采用各个target往pushgateway上push数据,然后prometheus去pushgateway上定时pull数据。
- 在监控业务数据的时候,需要将不同数据汇总, 汇总之后的数据可以由pushgateway统一收集,然后由 Prometheus 统一拉取。
解决不在同一网段的问题,pushgateway就相当于一个中间网关。相当于pushgateway要和target可以通同时和普罗米修斯也可以通。
Pushgateway 缺点
- Prometheus拉取状态只针对 pushgateway, 不能对每个节点都有效;
- Pushgateway出现问题,整个采集到的数据都会出现问题
- 监控下线,prometheus还会拉取到旧的监控数据,需要手动清理 pushgateway不要的数据。
三.Pushgateway 安装部署
下载安装包
代码语言:javascript
wget https://github.com/prometheus/pushgateway/releases/download/v1.5.1/pushgateway-1.5.1.linux-amd64.tar.gz
tar xvf pushgateway-1.5.1.linux-amd64.tar.gz
pushgateway-1.5.1.linux-amd64/pushgateway /usr/bin/
pushgateway -h #查看帮助
准备service文件
代码语言:javascript
root@prometheus-server-01:~# cat /lib/systemd/system/pushgateway.service
[Unit]
Description=Prometheus Pushgateway
After=network.target
[Service]
Type=simple
User=root
Group=root
ExecStart=pushgateway --web.listen-address=:9091
Restart=on-failure
[Install]
WantedBy=multi-user.target
启动服务
代码语言:javascript
systemctl daemon-reload
systemctl start pushgateway
systemctl status pushgateway
systemctl enable pushgateway
访问pushgateway界面
配置Prometheus抓取数据
在prometheus配置中添加job,抓取pushgateway数据,内容如下:
- job_name: pushgateway
honor_labels: true
static_configs:
- targets: ["192.168.122.21:9091"]
配置修改完成后重启Prometheus。然后在Prometheus界面查看target状态
测试
要推送数据到Pushgateway中,可以其提供的API接口来添加,默认URL地址为http://<ip>:9091/metrics/job/<job-name>/<label-name>/<label-value>
其中job-name是必填项,是job标签的值,后边可以跟任意数量的标签&标签值对,一般会添加一个instance/<instance-name>
标签来区分指标数据来源
测试向Pushgateway推送单条数据
执行如下命令进行单条数据推送
代码语言:javascript
#my_metric表示指标名称,2022表示指标值
echo "my_metric 2022"| curl --data-binary @- http://192.168.122.21:9091/metrics/job/test-job/instance/192.168.122.22
#再执行一次推送,将值改为2023
echo "my_metric 2023"| curl --data-binary @- http://192.168.122.21:9091/metrics/job/test-job/instance/192.168.122.22
在Pushgateway界面查看数据,如下图,可以看到只显示了最新值。
在Prometheus中查询my_metric,验证是否获取到数据。
测试向Pushgateway推送多条数据
代码语言:javascript
cat <<EOF | curl --data-binary @- http://192.168.122.21:9091/metrics/job/test-job/instance/192.168.122.22
#TYPE node_memory_total gauge
node_memory_total 10240000000
#TYPE node_memory_usage gauge
node_memory_usuge 1024000000
EOF
在Pushgateway界面查看数据
在Prometheus中查询,验证是否获取到数据
测试删除数据
代码语言:javascript
curl -X DELETE http://192.168.122.21:9091/metrics/job/test-job/instance/192.168.122.22
在Pushgateway界面验证
注意事项
通过Pushgateway方式,Prometheus无法直接检测到监控源服务的状态,故此种方式不适用于监控服务的存活状态等场景。
Pushgateway属于静态代理,它接收的指标不存在过期时间,故会一直保留直到该指标被更新或删除。此种情况下,不再使用的指标可能存在于网关中。
如上所言,Pushgateway并不算是完美的解决方案,在监控中更多做为辅助方案存在,用于解决Prometheus无法直接获取数据的场景。