prometheus之钉钉报警配置

1.上传安装包

1.上传最新得二进制安装包并解压
tar xf alertmanager-0.20.0-rc.0.linux-amd64.tar.gz
tar xf prometheus-webhook-dingtalk-0.3.0.linux-amd64.tar.gz
2.改名
mv alertmanager-0.20.0-rc.0.linux-amd64 alertmanager
mv prometheus-webhook-dingtalk-0.3.0.linux-amd64 prometheus-webhook-dingtalk

2.启动钉钉插件

钉钉创建机器人拿webhook上网一大堆

nohup ./prometheus-webhook-dingtalk --ding.profile="ops_dingding=自己钉钉得webhook"   & 

3.配置alertmanager

# 1.配置文件
vim alertmanager.yml
global:
  resolve_timeout: 5m
route:
  receiver: webhook
  group_wait: 30s
  group_interval: 5m
  repeat_interval: 4h
  group_by: [alertname]
  routes:
  - receiver: webhook
    group_wait: 10s
    match:
      team: node
receivers:
- name: webhook
  webhook_configs:
  - url: http://10.10.9.200:8060/dingtalk/ops_dingding/send #钉钉插件地址,ops_dingding和启动插件指定得名字一样
    send_resolved: true
  
# 2.启动alertmanager
nohup ./alertmanager --config.file=alertmanager.yml &

4.配置prometheus报警规则

#1.配置报警规则
vim rules.yml
groups:
    - name: test-rule
      rules:
      - alert: 主机状态
        expr: up == 0
        for: 2m
        labels:
          status: warning
        annotations:
          summary: "{{$labels.instance}}:服务器关闭"
          description: "{{$labels.instance}}:服务器关闭"

#2.修改prometheus配置让报警生效
vim prometheus.yml
# Alertmanager configuration
alerting:
  alertmanagers:
  - static_configs:
    - targets: ["10.10.9.200:9093"] #alertmanager地址
      # - alertmanager:9093

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  - "rules.yml"#指定报警规则文件
  # - "second_rules.yml"

3.重启prometheus

5.实验配置是否生效

1.关闭node监控
2.钉钉报警信息
[FIRING:1] 主机状态
Labels

alertname: 主机状态
instance: linux
job: node_export
status: warning
Annotations

description: linux:服务器关闭
summary: linux:服务器关闭
Source: http://test:9090/graph?g0.expr=up+%3D%3D+0&g0.tab=1

promethus报警状态
· Inactive:这里什么都没有发生。
· Pending:已触发阈值,但未满足告警持续时间(即rule中的for字段)
· Firing:已触发阈值且满足告警持续时间。警报发送到Notification Pipeline,经过处理,发送给接受者这样目的是多次判断失败才发告警,减少邮件。
  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
要在Prometheus中设置钉钉报警,你需要进行以下步骤: 1. 首先,你需要在Prometheus配置文件`prometheus.yml`中定义告警规则(AlertRule)。你可以使用Prometheus的查询语言(PromQL)来定义告警规则,以监测指标并触发告警。具体的告警规则配置可以参考\[1\]。 2. 接下来,你需要安装和配置Alertmanager。Alertmanager是Prometheus的一个报警通知组件,负责接收来自Prometheus的告警信息,并发送通知到不同的目标,比如钉钉。你可以从Alertmanager的官方GitHub页面下载并安装Alertmanager\[2\]。 3. 在Alertmanager的配置文件中,你需要添加钉钉配置信息。具体的配置可以参考Alertmanager的文档,其中包括钉钉的webhook地址、消息模板等信息。你可以根据需要自定义告警通知的内容和格式。 4. 最后,重新启动Prometheus和Alertmanager,使配置生效。 通过以上步骤,你就可以在Prometheus中设置钉钉报警了。当Prometheus监测到满足告警规则的条件时,会将告警信息发送给Alertmanager,然后Alertmanager会将告警通知发送到钉钉。这样,你就能及时收到钉钉上的告警通知了。 #### 引用[.reference_title] - *1* [Prometheus集成钉钉报警](https://blog.csdn.net/weixin_45203131/article/details/118545413)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [prometheus自定义钉钉报警](https://blog.csdn.net/qq_41892421/article/details/116761373)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值