前言-事件处理过程:
1、发现
2、认知
3、处置
4、后续
一、发现-事件来源
1、自动监控发现
1)Tivoli/Zabbix
2)NEM-Zabbix
3)Splunk
4)weblogic监控
5)第三方监控:基调、网宿、听云。。。
2、点检发现
一线值班人员根据点检手册,定时定量检查系统
3、业务反馈
业务人员、外部会员、测试人员
二、认知-事件识别
(一)监控的机制?报警的含义?监控的目的?
Tivoli/Zabbix/NEM:
实时状态:CPU、内存、分区容量占用、进程
应用日志
数据库定制化SQL
端口、URL
Splink:
收集日志-自定义监控策略
Weblogic:
Weblogic特有的属性的监控(Server、连接池等)
(二)理解报警内容,确认报警影响:
1)预警性(80%)
2)状态性(进程)
3)提示性(用户登录成功*)