用一百分总结这一年,只能给自己打80分。
随着年齿的增长,一个人扮演的角色会越来越多,评价的角度也变得多元化。
工作
这一年,工作节奏一如既往的飞奔。
加班已经成为家常便饭。
上半年,主要是两个大需求,一个是新的故障场景识别,属于新开发功能。
另一个是,新服务继续灰度,替代旧服务,覆盖所有线上集群。
在起初推进的时候,比较顺利。等功能上线一段时间之后,还是发现了问题,在特殊场景下,会触发。
一个服务,在访问量低的情况下,性能在各方面都表现优异。但随着承载流量规模的增加,问题就会暴露出来。
问题有些是历史遗留问题,有些是新引入的。
虽然没有造成事故,但是带来的教训是深刻的。这种阵痛感,如芒刺在背。
总结下来,原因包括:
(1).很大部分隐患是已经意识到,但没有坚持到底去解决,反而由于进度,选择性忽略。有很少部分隐患是盲区,完全没有意识到。
(2).项目进度推进太快,加上线上场景远比测试环境复杂,导致不能百分之百考虑到所有场景。
下半年,重点在稳定性建设上。
注意观察各种监控指标,以及日志。对于发现的异常点,刨根问底。找到根因。
在版本发布前的回归测试中,加大测试投入力度,各种场景覆盖全,保障版本发布的稳定性。
经过两个版本的迭代,稳定性得到很大提高。
简单小结下,
(1ÿ