服务器的智能监控管理结束,通过服务器监控告警进行异常排障

告警是服务监控应用及时发现、主动提醒用户异常的功能,保证了用户在任何情况下都能及时发现异常信息,提升 IT 人员运维的效率。

本教程介绍如何使用告警功能实现服务器的异常排障。

在目标监控机器上安装 logkit-pro

使用智能日志平台的服务监控应用,首先需要确保您的机器已经安装 logkit-pro,并开启机器监控。

1.登录 logkit-pro,进入机器管理页面,点击添加机器。

db2a7b1567b81bcab133e9d477cc3ace.png

2.手动安装:根据您机器的操作系统版本选择对应的命令,复制到命令行工具即可,如图所示:

a23012efaf3343a309ed678400bb9073.png

ed5cb84b429f99dba3e59aec08fcd59b.png

3.进入机器列表页,开启机器监控。

eedf1a91348b9a1a4404e37d43a15869.png

在服务监控应用监控机器

这样,您就可以在服务监控应用监控机器资源与性能指标。

进入智能日志平台应用平台,找到服务监控应用,点击进入应用。

进入服务监控应用即可看到目标服务器监控视图。

689b75afd0d5877d51c95176ad5363a3.png

创建报警通知对像

进入报警管理页面,在通知管理新建通知对象,下一步配置告警规则需要填写这个通知对象。

2ab588c13ba6455c04c2266cf8072696.png

f384de693aeba546f136f896636bdd16.png

配置报警规则

在报警规则 tab,创建指定监控项的报警规则,系统每隔 5 分钟聚合监控项指标,一旦监控项指标满足所配置的阈值,您将接收到报警信息。这里配置的报警规则是 CPU 使用率大于 40% 即报警。

87e70038b9d24d972cd726017d9964ff.png

运维人员接收告警信息

c4cf30f5dc079092cc0a8b07dab29ca5.png

进入报警管理页面,可以发现新增了一条报警事件,状态为未恢复。

2552a6b11c85ff9cf7f515feb3718730.png

观察服务器概览定位异常时间点,排查异常原因

接收到报警信息后,进入智能日志平台服务监控应用。

1.去服务器概览查看目标机器的 CPU 使用率时序监控视图,找出最近异常发生的时间节点。

190347282f0a63d79d23fd2ee7d4c65b.png

2.分析异常发生原因,及时处理异常。

异常处理完毕报警事件置为已恢复

异常处理完毕,您会收到一条异常回复信息。

fb8c3d5c98cbe0a6245d66bcde05f31e.png

进入报警管理页面,查看对应的报警事件,状态未已恢复代表异常已经处理完毕。

cc6edd1dc12383abe8e27b8071d776e3.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值