Prometheus实现钉钉报警

1、Prometheus实现钉钉报警

1.1 Prometheus环境

# my global config
global:
  scrape_interval: 15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).

# Alertmanager configuration
alerting:
  alertmanagers:
    - static_configs:
        - targets:
           - 192.168.204.195:9093

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  # - "first_rules.yml"
  # - "second_rules.yml"
  - "rule/*.yml" 

# A scrape configuration containing exactly one endpoint to scrape:
# Here it's Prometheus itself.
scrape_configs:
  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
  - job_name: "prometheus"
    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.
    static_configs:
      - targets: ["localhost:9090"]
    
  # 采集JVM监控数据
  - job_name: pushgateway
    static_configs:
      - targets: ['192.168.204.195:9091']
        labels: 
          instance: pushgateway
groups:
- name: node_rule
  rules:
  - alert: node memory usages
    expr: node_memory_usages > 20
    for: 10s
    labels:
      severity: high
    annotations:
      summary: "【监控告警】{{ $labels.exported_instance }}: 空间使用率异常"
      description: "【监控告警】{{ $labels.exported_instance }}: 空间使用率异常,请及时处理。"

启动情况:

在这里插入图片描述

1.2 pushgateway环境

启动情况:

在这里插入图片描述

1.3 自定义机器人并获取自定义机器人Webhook地址

1、首先创建一个群聊。

进入到钉钉软件的主页面后,点击右上角的加号按钮。

弹出加号里面的选项后,点击上面的发起群聊按钮。

进入到发起群聊界面后选择内部项目群,选择属于个人,点击上面的选择联系人选项。

进入到联系人界面后,选择要加入群聊的好友,最后点击右下角确定即可。

2、选择需要添加机器人的群聊,然后依次单击群设置 > 智能群助手 > 添加机器人。

3、点击添加机器人。

在这里插入图片描述

4、选择自定义。

在这里插入图片描述

5、点击添加。

在这里插入图片描述

6、输入相关信息,点击完成。

在这里插入图片描述

在这里插入图片描述

加签生成的随机码需要保存,后面会使用到。

7、点击完成。

在这里插入图片描述

这样我们就成功添加了自定义钉钉机器人并获取了 Webhook 地址。

获取到的Webhook的地址如下:

https://oapi.dingtalk.com/robot/send?access_token=57af98ce4cea66cb829df72c531efe093c6a254134ecf555f1

1.4 钉钉报警插件

访问github下载最新的插件(prometheus-webhook-dingtalk):

https://github.com/timonwong/prometheus-webhook-dingtalk/

这里下载 prometheus-webhook-dingtalk-2.1.0.linux-amd64.tar.gz

https://github.com/timonwong/prometheus-webhook-dingtalk/releases/download/v2.1.0/prometheus-webhook-dingtalk-2.1.0.linux-amd64.tar.gz

上传到服务器进步解压:

$ tar -xvf prometheus-webhook-dingtalk-2.1.0.linux-amd64.tar.gz

修改配置文件:

$ vim config.example.yml
# 将内容修改为
# Targets, previously was known as "profiles"
targets:
  webhook1:
    url: https://oapi.dingtalk.com/robot/send?access_token=57af98ce4cea66cb829df72c531efe093c6a254134ecf555f1
    # secret for signature
    secret: SEC5d2ad4bd4cea26830145472cdd7c8dda5b8bea57a029f4f7db7524
  webhook_mention_users:
    url: https://oapi.dingtalk.com/robot/send?access_token=57af98ce4cea66cb829df72c531efe093c6a254134ecf555f1
    mention:
      mobiles: ['18210820213']

启动:

$ nohup ./prometheus-webhook-dingtalk --config.file="config.example.yml" >> nohup.out 2>&1 &

1.5 alertmanager环境

global:
  resolve_timeout: 5m
route:
  group_by: ['alertname']
  group_wait: 15s
  group_interval: 30s
  repeat_interval: 2m
  receiver: 'web.hook'
receivers:
  - name: 'web.hook'
    webhook_configs:
      # prometheus-webhook-dingtalk的地址
      - url: 'http://192.168.204.195:8060/dingtalk/webhook1/send' 
        send_resolved: true
inhibit_rules:
  - source_match:
      severity: 'critical'
    target_match:
      severity: 'warning'
    equal: ['alertname', 'dev', 'instance']

启动情况:

在这里插入图片描述

1.6 触发报警

触发告警前:

在这里插入图片描述

# 执行该脚本触发告警
cat <<EOF | curl --data-binary @- http://192.168.204.195:9091/metrics/job/test_job/instance/test_instance
node_memory_usages 36
node_memory_total 36000
EOF

触发告警后:

在这里插入图片描述

在这里插入图片描述

钉钉接收到的消息:

在这里插入图片描述

如果恢复告警也会收到信息:

在这里插入图片描述

至此钉钉告警完成。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
一、prometheus简介 Prometheus是一个开源的系统监控和告警系统,现在已经加入到CNCF基金会,成为继k8s之后第二个在CNCF维护管理的项目,在kubernetes容器管理系统中,通常会搭配prometheus进行监控,prometheus支持多种exporter采集数据,还支持通过pushgateway进行数据上报,Prometheus再性能上可支撑上万台规模的集群。 二、prometheus架构图 三、prometheus组件介绍 1.Prometheus Server: 用于收集和存储时间序列数据。 2.Client Library: 客户端库,检测应用程序代码,当Prometheus抓取实例的HTTP端点时,客户端库会将所有跟踪的metrics指标的当前状态发送到prometheus server端。 3.Exporters: prometheus支持多种exporter,通过exporter可以采集metrics数据,然后发送到prometheus server端 4.Alertmanager: 从 Prometheus server 端接收到 alerts 后,会进行去重,分组,并路由到相应的接收方,发出报警,常见的接收方式有:电子邮件,微信,钉钉, slack等。 5.Grafana:监控仪表盘 6.pushgateway: 各个目标主机可上报数据到pushgatewy,然后prometheus server统一从pushgateway拉取数据。 四、课程亮点 五、效果图展示 六、讲师简介 先超(lucky):高级运维工程师、资深DevOps工程师,在互联网上市公司拥有多年一线运维经验,主导过亿级pv项目的架构设计和运维工作 主要研究方向: 1.云计算方向:容器 (kubernetes、docker),虚拟化(kvm、Vmware vSphere),微服务(istio),PaaS(openshift),IaaS(openstack)等2.系统/运维方向:linux系统下的常用组件(nginx,tomcat,elasticsearch,zookeeper,kafka等),DevOps(Jenkins+gitlab+sonarqube+nexus+k8s),CI/CD,监控(zabbix、prometheus、falcon)等 七、课程大纲
要在Prometheus中设置钉钉报警,你需要进行以下步骤: 1. 首先,你需要在Prometheus的配置文件`prometheus.yml`中定义告警规则(AlertRule)。你可以使用Prometheus的查询语言(PromQL)来定义告警规则,以监测指标并触发告警。具体的告警规则配置可以参考\[1\]。 2. 接下来,你需要安装和配置Alertmanager。Alertmanager是Prometheus的一个报警通知组件,负责接收来自Prometheus告警信息,并发送通知到不同的目标,比如钉钉。你可以从Alertmanager的官方GitHub页面下载并安装Alertmanager\[2\]。 3. 在Alertmanager的配置文件中,你需要添加钉钉的配置信息。具体的配置可以参考Alertmanager的文档,其中包括钉钉的webhook地址、消息模板等信息。你可以根据需要自定义告警通知的内容和格式。 4. 最后,重新启动Prometheus和Alertmanager,使配置生效。 通过以上步骤,你就可以在Prometheus中设置钉钉报警了。当Prometheus监测到满足告警规则的条件时,会将告警信息发送给Alertmanager,然后Alertmanager会将告警通知发送到钉钉。这样,你就能及时收到钉钉上的告警通知了。 #### 引用[.reference_title] - *1* [Prometheus集成钉钉报警](https://blog.csdn.net/weixin_45203131/article/details/118545413)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [prometheus自定义钉钉报警](https://blog.csdn.net/qq_41892421/article/details/116761373)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值