Prometheus
文章平均质量分 74
Prometheus
繁华依在
欢迎关注我的专栏,大家一起学习。
展开
-
七、alertmanager介绍及部署
在我们的灾备体系中,当原有集群故障宕机业务彻底无法访问的时候,会把用户流量切换到备份集群中,这样为故障集群及其提供的各个微服务状态发送警报机会失去了意义,此时, Alertmanager 的抑制特性就可以在一定程度上避免管理员收到过多无用的警报通知。2、停止node_exporter,当停止之后,根据规则配置,告警会触发 == 0 ,出发之后会发送告警信息给alertmanager,alert manager收到告警信息之后,会检查配置,然后发送邮件给相应负责人。当停止之后,有三种状态 ,详见第6步。原创 2024-05-22 10:16:48 · 837 阅读 · 0 评论 -
六、Prometheus服务发现
Prometheus默认是采用pull的方式拉取监控数据的,每一个被抓取的目标都要暴露一个HTTP接口,prometheus通过这个接口来获取相应的指标数据,这种方式需要由prometheus-server决定采集的目标服务器有哪些,通过配置在scrape_configs中的各种job来实现,无法动态感知新服务,如果后面新增了节点或组件,就需要手动修改prometheus配置,然后重启服务或重新加载配置,所以出现了动态服务发现。每次增加exporter修改Prometheus.yml估计早就烦了。原创 2024-05-21 09:27:09 · 428 阅读 · 0 评论 -
五、prometheus监控
在需要被监控的服务器上安装node_exporter安装步骤详见第一步修改prometheus 配置文件。原创 2024-05-20 09:31:17 · 170 阅读 · 0 评论 -
四、PushGateWay
Pushgateway是Prometheus的一个组件,prometheus server 默认是通过Exporter 主动获取数据,Pushgateway则是通过exporter主动方式推送数据到Pushgateway,再由Prometheus 主动去拉取Pushgateway数据,用户可以写一个自定义的监控脚本把需要监控的数据发送给Pushgateway。job是必须参数,label_name部分是可选的,URL中的job和label组合唯一标识pushgateway中Group。原创 2024-05-17 10:08:31 · 551 阅读 · 1 评论 -
三、安装node_exporter
Exporter是Prometheus的指标数据收集组件。它负责从目标Jobs收集数据,并把收集到的数据转换为Prometheus支持的时序数据格式。和传统的指标数据收集组件不同的是,他只负责收集,并不向Server端发送数据,而是等待Prometheus Server 主动抓取。原创 2024-05-15 10:07:49 · 314 阅读 · 0 评论 -
二、安装、使用Grafana
import 模板ID需要机器能够上网,如果机器不能上网通过导入json文件完成。推荐模板ID 1860、15172(基于11074模板做的优化)数据源选择prometheus。Json文件上传11074模板。导入下载好的json文件。一、安装Grafana。创建systemd服务。访问grafana前端。二、使用grafana。ID导入1860模板。原创 2024-05-13 16:11:01 · 398 阅读 · 0 评论 -
一、Prometheus介绍及部署
Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB)global:alerting:- targets:# 抓取配置列表# node_exporter配置labels:instance: Prometheus服务器labels:instance: test主服务器。原创 2024-05-11 14:43:19 · 971 阅读 · 0 评论