思路
大致看一下Nginx http upstream check status的表单结构去分析
1.主要去提取Status状态up/down 去报警
2.脚本返回0位正常,其他位不正常
脚本
#!/usr/bin/python3
# chenzhenhua
######用于zabbix监控Nginx健康检查,正常返回restult给zabbix为0 有不正常返回非0报错
from lxml.html import parse
from urllib.request import urlopen
#import pandas as pd
def status():
restult = 0
url="http://172.16.5.11/status" ###Nginx健康检查的地址
try:
urlopen(url)
except:
restult = 100 ######无法请求到地址,返回100
else:
parsed = parse(urlopen(url))
doc=parsed.getroot()
# print(parsed)
# print("------------------------")
# print(doc)
tables = doc.findall('.//tr') ###取table值
if len(tables) <= 1: ####如果没有开启的话只有抬头栏目,返回99
restult = 99
else:
for i in tables[1:]:
name = i[2].text_content() ###name列
status = i[3].text_content() ###状态列
# td=tables[1].findall('.//td')
# s1 = td[2].text_content()
# s2 = td[3].text_content()
if status=="up":
continue ###up表示正常不累加
else:
restult = restult + 1 ####非up表示不正常,累加1,最后只要返回非0即报错
namelist.append(name)
return restult
if __name__ == "__main__":
namelist = []
s=status()
# print(s)
if s == 0:
print(s) #####0正常
elif s == 100:
print("nginx is down") ####100 Nginx端口没开
elif s ==99:
print("health status is down") #####99 Nginx健康检查没开
else:
print("%s is down"%namelist) ######其他 返回相关ip端口列表让zabbix去报警即可
配置
1.修改服务器agent配置:
vi /etc/zabbix/zabbix_agentd.conf 添加
UnsafeUserParameters=1
UserParameter=nginx_status_healthy,/usr/bin/python3 /scripts/nginx_status_healthy.py
2.Zabbix 主机添加监控项
添加监控(注意信息类型日志格式)
3.添加触发器(zabbix5版本)
如果是3.0版本的zabbix触发器要特殊配置(日志中是否匹配到down这个值进行判断,要么会报错)
测试
如果有down发生报警