常规故障排错流程

这篇博客详细介绍了常规故障排错流程,包括事件的发现(如通过自动监控、点检和业务反馈)、认知阶段(理解报警内容和影响)、处置步骤(查找原因并解决)以及后续的事件总结和预防措施。常见故障类型包括应用系统故障、数据传输问题、功能异常、数据库问题和个别用户异常等。
摘要由CSDN通过智能技术生成

前言-事件处理过程:

1、发现
2、认知
3、处置
4、后续

一、发现-事件来源

1、自动监控发现
1)Tivoli/Zabbix
2)NEM-Zabbix
3)Splunk
4)weblogic监控
5)第三方监控:基调、网宿、听云。。。

2、点检发现
一线值班人员根据点检手册,定时定量检查系统

3、业务反馈
业务人员、外部会员、测试人员

二、认知-事件识别

(一)监控的机制?报警的含义?监控的目的?
Tivoli/Zabbix/NEM:
实时状态:CPU、内存、分区容量占用、进程
应用日志
数据库定制化SQL
端口、URL

Splink:
收集日志-自定义监控策略

Weblogic:
Weblogic特有的属性的监控(Server、连接池等)

(二)理解报警内容,确认报警影响:
1)预警性(80%)
2)状态性(进程)
3)提示性(用户登录成功*)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值