hadoop 集群监测_Python + 钉钉自制简易hadoop节点异常告警

利用Python定时访问Hadoop管理页面,通过XPath解析Lost Nodes和Unhealthy Nodes状态,当节点异常不为0时,通过已设置的钉钉机器人发送告警通知。实现每5分钟监测一次,确保集群稳定运行。
摘要由CSDN通过智能技术生成
a0cb58cd843360375ef656e6b1eff657.png e64a067a69c8b6a2f310a90e29f3c859.png今儿早上班跑数据的时候,突然发现任务全部卡死,查看了下hadoop管理页面之后,发现节点全部都出问题了,导致数据任务无法执行,集群出问题了也没个提示,反正也挺难受的,在运维老哥的怂恿下,写个简易的脚本去监控集群的健康情况,然后做到及时提醒。 e64a067a69c8b6a2f310a90e29f3c859.png

8f227ee12aa4716dc3dc36e5ac442e9f.png

思路很简单,用Python去定时访问hadoop管理页面,爬取Lost Nodes与Unhealthy Nodes 的数值,如果不是0的话就抛出异常,再通过钉钉机器人去告警,反之如果为0就是正常。

有了思路,那么代码写起来就很快了。

首先我们用requests模块请求这个管理页面的地址,接着用XPath解析这两个数值的路径

1c05e4ff2f7a5cc00a9178fb412a4a5a.png

右键拷贝出XPath路径之后,得到XPath路径为

'//*[@id="metricsoverview"]/tbody/tr/td[14]/a'

接下来开始上Python,首先我们这里需要用到以下几个包:

im
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值