今天参加一个培训,是关于Wily监控如何理解各种指标的。现在随着业务规模逐步放大,客户的it建设也逐步上台阶。去年,客户逐步实施Itil服务管理,建立起一线、二线和三线处理事件和问题机制。同样,对系统可用性、稳定性也提出更高要求。目前,上Wily后,基本上可以做到24*7的监控关键系统,中间件的内存和线程使用情况,主机cpu使用率,sql后台响应时间、前台业务响应时间等。Wily会搜集各种数据(Agent和EM相互通信),在这基础上,根据之前制定的指标,阈值,条件等,进行报警,显示黄灯、和红灯。对于红灯这种情况,可能就要特殊关注啦,说不定系统已经不可用。如指标中有http不可用,红灯条件是1分钟内打不开首页,这时就会报警,又或者是空闲线程数少于多少个,系统报警等。呵呵,系统不可用,运维的各位领导和同事会立即收到短信,要是指标太多也是不胜其烦的。
客户不断在进步,我们的系统还是原先那一套,呵呵,有危机呀。
[@more@]来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/21327621/viewspace-1020714/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/21327621/viewspace-1020714/