prometheus问题赏析-填坑的心路历程

话不多说,内容奉上。

一、关于默认时区为世界时

prometheus强制使用UTC世界统一时间,比实际北京时间早8个小时,可以在grafana修改时间为浏览器当前时间。
在这里插入图片描述

二、关于prometheus服务如何实现配置热加载

生产环境在用prometheus修改配置后如何在不影响正常使用的前提下更新配置,需要启动带如下参数:

 --web.enable-lifecycle --web.enable-admin-api

热加载语法:

curl -X POST http://ip:9090/-/reload

三、grafana如何重置管理员密码

登录grafana服务器,执行如下语句:

grafana-cli admin reset-admin-password newpass

四、关于PromQL (Prometheus Query Language)两个指标运算返回no data

prometheus两个及以上指标参与运算时,两个指标具有不同的标签值,无法匹配,导致两个正常的指标组合运算后返回no data。

原因是: 当 prometheus 对表达式求值时,该操作隐式应用于共享相同标签集的指标。尽管指定了指标名称和大多数标签,但 Prometheus 一直在寻找具有相同标签集的指标。

举例: 一个指标具有标签 metric=“Used”,另一个指标具有标签 metric=“Total”.可能是其中一个指标具有一些额外的标签,即会导致运算结果无返回值。

解决方案: 使用ignore(或on)来减少考虑的标签集。

真实解决案例:
prometheus运算要求两个指标必须拥有相同的标签集,这两个指标的标签集存在差异。有两种可以实现计算的方法:
1、使用ignoring(node),忽略差异的标签,如:

jenkins_node_builds_count{node="master"} /ignoring(node)(default_jenkins_uptime / 1000 / 60 / 60)

2、比较取巧的方法,通过max,min等计算符将结果转换为数值进行计算,而非prometheus数据类型,如:

max(jenkins_node_builds_count{node="master"}) /max((default_jenkins_uptime / 1000 / 60 / 60))

五、alertmanager CPU告警恢复未正常发送信息给到第三方告警平台

发现是告警语句问题,具体逻辑摸索中,征求大家原理分析下:
原告警语句:

 100 - (avg(irate(node_cpu_seconds_total{hostip=~"ip:.*",mode="idle"[2m])) *100)>80

调整后正常:

100(1 - avg(irate(node_cpu_seconds_total{hostip=~"ip:.*",mode="idle"}[2m]))by(instance))>80
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
prometheus-webhook-dingtalk 是一个用于将 Prometheus 监控告警消息发送到钉钉的 Webhook 工具。它可以帮助你将 Prometheus 监控告警通过钉钉机器人发送到指定的群组或用户。 你可以通过以下步骤来配置和使用 prometheus-webhook-dingtalk: 1. 安装 prometheus-webhook-dingtalk:你可以使用 Go 工具链来安装 prometheus-webhook-dingtalk,运行以下命令: ``` go get github.com/timonwong/prometheus-webhook-dingtalk/cmd/dingtalk ``` 2. 创建钉钉机器人:在钉钉中创建一个自定义机器人,并获取到它的 Webhook 地址,用于将告警消息发送到指定的群组或用户。 3. 创建配置文件:在 prometheus-webhook-dingtalk 的配置文件中,你需要指定钉钉机器人的 Webhook 地址以及其他相关参数。你可以创建一个名为 config.yml 的配置文件,并将以下示例内容填入: ```yaml listen: 0.0.0.0:8060 dingtalk: webhook: https://oapi.dingtalk.com/robot/send?access_token=your_webhook_token ``` 4. 启动 prometheus-webhook-dingtalk:运行以下命令来启动 prometheus-webhook-dingtalk: ``` dingtalk -config.file=config.yml ``` 5. 配置 Prometheus:在 Prometheus 的配置文件中,添加以下内容来指定告警消息的接收端: ```yaml receivers: - name: 'dingtalk' webhook_configs: - url: 'http://prometheus-webhook-dingtalk:8060/dingtalk/webhook' ``` 6. 重新启动 Prometheus:确保 Prometheus 已经重新加载了配置文件,并重启 Prometheus 服务。 现在,当 Prometheus 监控触发告警时,prometheus-webhook-dingtalk 将会将告警消息发送到钉钉机器人的 Webhook 地址,从而通知到指定的群组或用户。 请注意,以上步骤仅为一般示例,实际操作可能会因环境和需求而有所不

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值