我们目前做一个运维的项目,我们是乙方,甲方是一个国家企事业单位。
甲方是一个效率很高的单位,人尽其用,人尽其才。说白了,就是每个人都是人才,管理的事都很多,这里看不见其他国企里面人浮于事的现象。
我负责的工作很多,其中包括一个监控软件组的管理,目前这个小组的工作是升级这家单位所有生产服务器上面的监控软件。
所谓监控软件,就是说,如果某服务器出现了问题,可以把问题报告出来,这类软件一般会有短信接口,把报警信息发送到手机上。
甲方还有开发处,其中的开发处处长和副处长的手机号都在某个应用系统的报警组里面,也就是说,假如这个系统的某个服务器出现问题,那么包括正副处长在内的人,都可以收到报警,可见他们亲历亲为的作风了。
但是因为最近我们升级和优化系统监控软件,他们处长提出一个要求,就是有点报警是属于系统消息类的,不是系统有故障或者问题,而是属于告知的消息,他们不希望有类似短信干扰他们。
他们通过甲方管理我们的运维处处长,想让我们修改监控软件设置,我于是把这件事告诉了监控软件组组长,跟他说了事情的严重性,说这是人家开发处处长的需求,要优先解决。他说可以解决这个问题,于是修改了脚本,那些告警信息就不发送到手机上了。
顺便说一下,我自己的手机在所有的告警组里面,也就是说,甲方任何一台服务器报警,我都能收到,最多一天我也就收到20条左右的短信。
如果事情到此结束,就没有故事可讲了。
过了几天,另一类型的消息信息又发送到了手机上,于是那个开发处长又告状到我们的运维处处长这里。
运维处长有找我,我再找监控软件组组长,并且告诉他,这是最后一次,以后不能再犯类似错误,于是这类信息又被屏蔽掉,问题解决了。
问题解决了吗?
当几天后,第三种类型的消息发送到手机上的时候,我觉得问题不能这样周而复始了,我们必须采取主动。
于是我和监控软件组组长一起分析问题的原因,有些报警信息不是同一类型的,事先不能完全判断出来,必须通过时间来检验的。最后我们达成一致,不管别的处处长给我们的压力,我们只需要处理这些发现的问题,出来了,再解决,不用单独花时间解决这个问题。除此之外,我们只需要按照我们的计划执行升级操作。
之后,我通过我们运维处长找到了开发处长,和他面对面的谈了这个事情。
我先和他说明,我们很重视他反应的这个事情,我已经下了死命令要监控组来解决这个问题,但是经过两次事情之后,我发现监控组没有完全解决这个问题,我和他说,我这个监控组的执行力很强,我以前的命令都不折不扣的执行了,而且每次完成的很好,因为我对他们管理的很严,这次这个问题现在还没有完全解决,说明他们真的在短期内是解决不了的,需要花一定时间来整理了。
我希望开发处长可以理解我们,给我们时间。
同时我也解释这个问题久拖不决的原因,因为服务器报警信息有多种多样,在它报告出来之前,我们无法确定是属于有害告警还是属于无害消息。如果为了这个问题再单独花时间整理以前所有报警信息,再分类,这样时间会很长,而我们目前的当务之急是升级甲方的服务器监控,因为还有几十台服务器是带故障运行,万一这些服务器出现问题,有可能监控软件报告不出来,这才是当务之急。
最后我承诺,升级完成后,会尽快解决他这个问题。
开发处长还说,他们每天收到服务器报警都很紧张,担心服务器宕机或者掉线,结果都是无关紧要的信息。
我还给他们解释,我一天收到(甲方)XXX单位所有的报警,我们运维人员其实更紧张,这些报警信息不过几十条,你们一天最多就收到3,4条报警,不算多,而且我还恭维他们,能当官的都是忍耐力超过普通人的主,向我这样有牢骚就发,动不动就抱怨的人当不了官。我一天就收到几十条短信......
最后呢,当然是皆大欢喜,开发处长同意我们的意见。
由此,我想到,出了问题,如何解决当然是至关重要的,但是如果问题一直没有解决,我们可以换个思路,不一定非要从乙方入手解决,也可以做做甲方的工作。
只不过这样让甲方妥协的事情还是少点的好。
阿弥陀佛。
[@more@]来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/10771/viewspace-1051956/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/10771/viewspace-1051956/