Alertmanager实现企业微信机器人webhook告警

1. 说明

由于企业微信更新问题,现在已经无法直接使用创建应用后在alertmanager的配置文件中定义企业id及secret就可以发送告警信息了,除非填写备案后域名;为了我们这种个人开发者非常的不便,所以本文档是为了解决想使用企业微信告警但又无法备案的朋友;下面只是我的操作过程记录

如果没有自定义的需求可以直接使用我的镜像可以直接使用我的镜像:kfreesre/prometheus-flask:latest

2. 环境

我这里的监控是在kubernetes中部署的(kube-prometheus);镜像是公开的,可直接下载;告警内容可自定义;

3. 步骤

3.1 下载项目并自定义编译内容;

# clone项目(已点start)
~] git clone https://github.com/hsggj002/prometheus-flask.git

# 修改Dockerfile
~] vim prometheus-flask/Dockerfile
FROM python:3.10.2
COPY ./app /app
COPY ./requirements.txt /app/requirements.txt
WORKDIR /app
# 指定了一下国内镜像,由于requirement.txt中有要安装的包,下载又很慢,所以选择国内镜像;
RUN pip install -r /app/requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
# 原本是CMD的,这样我们在K8s中部署不好传参,所以改了entrypoint;
ENTRYPOINT ["python", "/app/main.py"]

# 修改requirements.txt文件
~] vim prometheus-flask/requirements.txt
flask_json == 0.3.4
flask == 2.0.1
requests == 2.19.1
gevent == 21.12.0    
# 增加此行,我第一次发布镜像时报错了,加了这行得以解决;
Werkzeug == 2.0.1

3.2 修改源码

~] vim app/Alert.py
# 博主中的源码告警中多机房,所以代码中有,但我这里没有,所以去掉;
# https://github.com/hsggj002/prometheus-flask/issues/3
# 下面图一为仅修改了region参数的告警信息;但我这里想增加pod_name并且恢复告警的内容中没有定义恢复时间
# 为了解决这两个问题,我将Alert.py改了一下,可以直接使用;
# 下面图二是修改后的告警;
# -*- coding: UTF-8 -*-
from doctest import debug_script
from pydoc import describe
from flask import jsonify
import requests
import json
import datetime
import sys

def parse_time(*args):
    times = []
    for dates in args:
        eta_temp = dates
        if len(eta_temp.split('.')) >= 2:
            if 'Z' in eta_temp.split('.')[1]:
                s_eta = eta_temp.split('.')[0] + '.' + eta_temp.split('.')[1][-5:]
                fd = datetime.datetime.strptime(s_eta, "%Y-%m-%dT%H:%M:%S.%fZ")
            else:
                eta_str = eta_temp.split('.')[1] = 'Z'
                fd = datetime.datetime.strptime(eta_temp.split('.')[0] + eta_str, "%Y-%m-%dT%H:%M:%SZ")
        else:
            fd = datetime.datetime.strptime(eta_temp, "%Y-%m-%dT%H:%M:%SZ")
        eta = (fd + datetime.timedelta(hours=8)).strftime("%Y-%m-%d %H:%M:%S.%f")
        times.append(eta)
    return times

def alert(status,alertnames,levels,times,pod_name,ins,instance,description):
    params = json.dumps({
        "msgtype": "markdown",
        "markdown":
            {
                "content": "## <font color=\"red\">告警通知: {0}</font>\n**告警名称:** <font color=\"warning\">{1}</font>\n**告警级别:** {2}\n**告警时间:** {3}\n**Pod名称**: {4}\n{5}: {6}\n**告警详情:** <font color=\"comment\">{7}</font>".format(status,alertnames,levels,times[0],pod_name,ins,instance,description)
            }
        })

    return params

def recive(status,alertnames,levels,times,pod_name,ins,instance,description):
    params = json.dumps({
        "msgtype": "markdown",
        "markdown":
            {
                "content": "## <font color=\"info\">恢复通知: {0}</font>\n**告警名称:** <font color=\"warning\">{1}</font>\n**告警级别:** {2}\n**告警时间:** {3}\n**恢复时间:** {4}\n**Pod名称:** {5}\n{6}: {7}\n**告警详情:** <font color=\"comment\">{8}</font>".format(status,alertnames,levels,times[0],times[1],pod_name,ins,instance,description)
            }
        })

    return params

def webhook_url(params,url_key):
    headers = {"Content-type": "application/json"}
    """
    *****重要*****
    """
    url = "{}".format(url_key)
    r = requests.post(url,params,headers)

def send_alert(json_re,url_key):
    print(json_re)
    for i in json_re['alerts']:
        if i['status'] == 'firing':
            if "instance" in i['labels'] and "pod" in i['labels']:
                if "description" in i['annotations']:
                    webhook_url(alert(i['status'],i['labels']['alertname'],i['labels']['severity'],parse_time(i['startsAt']),i['labels']['pod'],'故障实例',i['labels']['instance'],i['annotations']['description']),url_key)
                elif "message" in i['annotations']:
                    webhook_url(alert(i['status'],i['labels']['alertname'],i['labels']['severity'],parse_time(i['startsAt']),i['labels']['pod'],'故障实例',i['labels']['instance'],i['annotations']['message']),url_key)
                else:
                    webhook_url(alert(i['status'],i['labels']['alertname'],i['labels']['severity'],parse_time(i['startsAt']),i['labels']['pod'],'故障实例',i['labels']['instance'],'Service is wrong'),url_key)
            elif "namespace" in i['labels']:
                webhook_url(alert(i['status'],i['labels']['alertname'],i['labels']['severity'],parse_time(i['startsAt']),'None','名称空间',i['labels']['namespace'],i['annotations']['description']),url_key)
            elif "Watchdog" in i['labels']['alertname']:
                webhook_url(alert(i['status'],i['labels']['alertname'],'0','0','0','故障实例','自测','0'),url_key)
        elif i['status'] == 'resolved':
            if "instance" in i['labels']:
                if "description" in i['annotations']:
                    webhook_url(recive(i['status'],i['labels']['alertname'],i['labels']['severity'],parse_time(i['startsAt'],i['endsAt']),i['labels']['pod'],'故障实例',i['labels']['instance'],i['annotations']['description']),url_key)
                elif "message" in i['annotations']:
                    webhook_url(recive(i['status'],i['labels']['alertname'],i['labels']['severity'],parse_time(i['startsAt'],i['endsAt']),i['labels']['pod'],'故障实例',i['labels']['instance'],i['annotations']['message']),url_key)
                else:
                    webhook_url(recive(i['status'],i['labels']['alertname'],i['labels']['severity'],parse_time(i['startsAt'],i['endsAt']),i['labels']['pod'],'故障实例',i['labels']['instance'],'Service is wrong'),url_key)
            elif "namespace" in i['labels']:
                webhook_url(recive(i['status'],i['labels']['alertname'],i['labels']['severity'],parse_time(i['startsAt'],i['endsAt']),'None','名称空间',i['labels']['namespace'],i['annotations']['description']),url_key)
            elif "Watchdog" in i['labels']['alertname']:
                webhook_url(alert(i['status'],i['labels']['alertname'],'0','0','0','故障实例','自测','0'),url_key)

图一Untitled

图二Untitled

3.3 制作镜像

~] docker build -t kfreesre/prometheus-flask:latest .

3.4 部署至kubernetes中

apiVersion: apps/v1
kind: Deployment
metadata:
  name: alertinfo
  namespace: monitoring
spec:
  replicas: 1
  selector:
    matchLabels:
      app: alertinfo
      release: stable
  template:
    metadata:
      labels:
        app: alertinfo 
        release: stable
    spec:
      containers:
      - name: alertinfo-flask
        image: kfreesre/prometheus-flask:latest
        imagePullPolicy: Always
        ports:
        - name: http
          containerPort: 80
        args:
				# 企业微信的webhook-key如何获取可以google一下;很简单,这里不说明了;
        - "-k https://qyapi.weixin.qq.com/cgi-bin/webhook/send?key=你自己的webhook-key"
        - "-p 80"
---
apiVersion: v1
kind: Service
metadata:
  name: alertinfo-svc
  namespace: monitoring
spec:
  selector:
    app: alertinfo
    release: stable
  type: ClusterIP
  ports:
  - name: http 
    targetPort: 80
    port: 80
~] kubectl apply -f ./alertinfo.yaml

3.5 修改alertmanager配置

global:
  resolve_timeout: 5m
  smtp_smarthost: "xxx"
  smtp_from: "xxxx"
  smtp_auth_username: "xxx"
  smtp_auth_password: "xxx"
  smtp_require_tls: true
# 告警模板指定
templates:
  - '/etc/template/config/email.tmpl'
route:
  group_by: ['job', 'severity']
  group_wait: 30s
  group_interval: 5m
  repeat_interval: 12h
  receiver: 'wechat'
  routes:
  - match_re:
      severity: ^info|warning|critical$
    receiver: 'operation'
    continue: true
  - match_re:
      severity: ^info|warning|critical$
    receiver: 'wechat'
    continue: true

receivers:
- name: 'operation'
  email_configs:
  - to: "xxxxx"
    html: '{{ template "email.html" . }}'
    headers: { Subject: "[WARN] 报警邮件" }
    send_resolved: true
#receivers:
- name: 'wechat'
  webhook_configs:
	# 这里是svc的名称;
  - url: 'http://alertinfo-svc/alertinfo'
    send_resolved: true
inhibit_rules:
  - source_match_re:
      severity: 'critical|warning'
    target_match:
      severity: 'info'
    equal:
    - instance

4. 参考

使用企业微信群机器人接收prometheus报警信息 - hsggj - 博客园 (cnblogs.com)

https://github.com/hsggj002/prometheus-flask

  • 6
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 企业微信机器人是一种能够自动发送告警信息的工具。Python是一种强大的编程语言,可以用于编写企业微信机器人告警信息功能。 在使用Python编写企业微信机器人告警信息功能时,我们可以使用企业微信提供的API接口来发送告警信息。首先,我们需要在企业微信后台创建一个机器人,并获取到机器人的Webhook地址。然后,使用Python的requests库发送POST请求到这个Webhook地址,将告警信息作为请求的参数发送给企业微信。 在编写Python代码时,可以使用requests库中的post方法来发送POST请求。首先需要导入requests库,然后设置请求的URL和告警信息的内容。最后,调用post方法发送请求。 下面是一个简单的示例代码: ``` import requests def send_alert(alert_message): url = "企业微信机器人Webhook地址" data = { "msgtype": "text", "text": { "content": alert_message } } response = requests.post(url, json=data) if response.status_code == 200: print("告警信息发送成功") else: print("告警信息发送失败") # 调用发送告警信息的函数 send_alert("服务器发生故障!") ``` 以上代码中,首先设置了企业微信机器人Webhook地址,然后构造了一个包含告警信息的字典data。接下来,使用requests库的post方法发送POST请求,并根据返回的状态码判断告警信息是否发送成功。 通过这种方式,Python可以很方便地实现企业微信机器人告警信息功能,帮助企业及时接收并处理可能的故障和异常情况。 ### 回答2: Python 企业微信机器人可以方便地实现告警信息的推送和管理。企业微信是一款企业级即时通讯工具,通过Python编写的机器人可以与企业微信平台进行交互,实现告警信息的即时推送和管理。 使用Python编写的企业微信机器人可以通过调用企业微信提供的接口,将告警信息发送给指定的用户或群组。例如,当系统出现故障或发生异常情况时,可以通过Python脚本获取相关信息,并使用机器人将告警信息推送给相关的人员,以便及时处理和解决问题。 通过Python编写的企业微信机器人还可以实现告警信息的管理和统计。机器人可以获取和记录告警信息,并对其进行分类、过滤和统计。例如,可以记录每天的告警次数、告警级别等信息,以便进行分析和监控,及时发现系统瓶颈和异常情况。 此外,Python编写的企业微信机器人还可以实现自定义的告警推送规则和方式。可以根据不同的告警类型和级别,设置不同的推送方式,如消息、邮件、电话等。可以根据具体需求定制机器人的行为,提高告警信息的及时性和准确性。 总之,Python 企业微信机器人是一种高效、灵活和方便的告警信息管理工具。通过使用Python编写的机器人,可以实现告警信息的即时推送和管理,提高团队的工作效率和问题处理速度。 ### 回答3: Python 企业微信机器人是一种使用 Python 编写的工具,用于向企业微信发送告警信息。企业微信是一款企业即时通讯应用,而告警信息是指在系统运行过程中出现的异常情况或重要事件,需要及时通知相关人员处理的消息。 Python 企业微信机器人具有以下优点: 1. 简便易用:使用 Python 编写的机器人代码简洁明了,易于理解和维护。只需要导入相关库,编写少量代码即可实现告警信息的发送。 2. 定制化:机器人支持自定义告警信息的格式和内容。可以根据业务需求,灵活设定告警级别、告警内容、接收人等参数。 3. 高效可靠:Python 语言具有良好的性能和稳定性,在发送告警信息时能够保证消息的实时性和可靠性。 4. 扩展性强:Python 拥有丰富的第三方库,可以结合其他库实现更多功能需求。例如,可以通过调用其他库获取系统监控数据,将实时监控数据与告警信息结合发送,提高系统监控和告警的综合能力。 使用 Python 企业微信机器人发送告警信息的流程一般如下: 1. 导入企业微信机器人相关库。 2. 设置企业微信机器人的相关参数,如机器人的 Webhook URL、告警等级、接收人等。 3. 构造告警信息的内容,可以包括日期、时间、异常信息等。 4. 将告警消息通过机器人发送给企业微信内指定的接收人。 通过以上步骤,企业微信机器人就可以快速将告警信息发送给相关人员,及时通知和解决系统运行中出现的异常情况,提高系统的可用性和稳定性。同时,通过 Python 的灵活性和丰富的第三方库支持,机器人还可以进一步扩展自己的功能,以满足不同场景下的告警需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值