api 监控告警+定点发送监控日报

文章介绍了三种API监控告警的方法,从分析nginx-log到使用Prometheus监控延迟响应,最终选择了通过Blackbox监控,并优化了展示最大延迟的API链接。公司认可了利用Blackbox进行监控的方案,通过PromQL查询最大探测时间,并配置定时告警在每天6点发送最高延迟的API链接。
摘要由CSDN通过智能技术生成

api 及时监控告警+定点发送监控日报



必看

我们有个需求:
1、就是api 监控,出现问题及时告警
2、每天6点定时发送今天,最高延迟的 api链接(相当于是一个日报)


方法一

我们可以通过监控nginx-log ,可以获取到 api 响应延迟

在这里插入图片描述
这是第一版,没有优化,其实可以实现过滤只发送需要的关键信息,被公司否定掉了

方法二

监控nignx 程序
在这里插入图片描述
prometheus 监控 nginx 对域名 各种状态 比如 1xxx 2xxx 3xxx 比如 图同的 4开头的错误被记录 4次,也有延迟响应,可以实现告警

因为所有流量都有走的nginx 所以nginx 能看到很多信息,比第一个 监控 日志跟好用,

在这里插入图片描述

也被公司否认了

方法3 被公司认可

还记得 我之前讲过的 blackbox 吗 不记得可以回去看看

通过 blackbox 进行监控

想看成果
在这里插入图片描述

我个人认为这种方法并不友好,公司认可就行,开搞

1、首先确保你们的 blackbox 已经正常运行并且监控,不会的这部分自己看看我过去的博客
在这里插入图片描述
probe_duration_seconds 这个是 promQL 语句哦,
用于记录各个目标的探测时间,即探测请求从发送到接收的时间间隔。这个指标通常用于计算目标的可用性和响应时间。通过Prometheus来查询来分析和监控该服务的性能。

是不是 可以看到对应的 api 和 响应时间,
第一点达到公司要求

第二点 查看今天 最高的 延迟时间
在这里插入图片描述
这里一个API 记录了每一秒的响应时间,我们需要做个优化 对比最大值
在这里插入图片描述

这里最大值,对比出来了,但是还有一个一个问题,太多了,发送到群里 没必要全部看,值看关键的,比如 大于 5秒的

在这里插入图片描述
这里就展示了 api 一天的 最大链接时间,并显示 > 5秒的

然后就是 配置 定时告警就可以了

这里+8 是因为是 UTC 时间,+8 到我们中国本地时间


    - name: API 定时日报
      rules:
      - alert: pod-memory
        expr: topk(50,max_over_time(probe_duration_seconds[1d])) %(3600*24)/3600+8)==6 and %(3600*24)/60%60)<10
        for: 30s
        labels:
          severity: 警告
        annotations:
          description: "{{ $value }})"


-----------------------------------
prometheus定时定点发送告警

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

「已注销」

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值