一年半了,产品终于上线了,昨天从晚上9点多搞到今天中午快12点,原以为之前几次演练都问题不大,现在上线了应该问题更少,谁曾想一上线问题一堆一堆的,一直忙了10几个小时都没有休息,回头想想很多问题是可以避免的,却还是发生了。
COTS上线,发现启动失败,一查日志,发现报错,反编译类发现不是最新的代码,原来有一些代码被修改了,但是没有被记录下来,上线前T拿了production上的jar包更新了所有被记录下来修改过的类,但是这些没有记录下来的就被遗漏了,但是这样大的失误却没有在测试服务器上发现,说明这个包根本没有被测试。虽说这包不是我准备的,但是T是我团队的,所以我还是有不可推卸的责任,我没有把住关,没有以高度的责任感对待上production的包,这是我的失职。
CUG上线,出现了一个小问题,这个问题之前发现过,也改过,并且我自己在测试服务器上测试过,没有问题,不知道为什么最后上线的这个包却不是最新的,这里面有两个问题:
1. CUG是我负责改的,我也准备了集成的包,并测试了,但是上各种服务器的包都是T发的,因为太忙,我也没有很好的划分好这个责任,也没有去检查他发的包。
2. 我没有以主人翁的意识对待CUG这个项目,因为T发了包,我也就让他去负责了,但是他又不是负责改这个项目的人,所以出些纰漏也难免,我不应该以忙为借口,而忽略了对这个项目应有的责任。
IBE上线也遇到了大问题,一个hibernate查询导致了严重的性能问题,而这之前一直没有被发现,我们的代码review做得很不够,而可能的大数据压力测试也没有做到。
另外我发现香港的同事,对linux的使用非常熟悉,对各种环境和业务也很熟悉,解决问题特别快,这是我们应该学习的,我老是专注在技术,而且兴趣太广,却没有深度,这是缺点,而且,我太不重视业务,这是要做SA,做架构,做PM很致命的不足,所以一定要改进,我一定要开始重视业务的学习,不要以为学习业务是浪费时间。
通过这次上线,我发现了自己的很多问题,一直都自诩能力不错,却是井底之蛙,更努力一些吧!