做了3年运维工作,觉得以下5项准则需要努力贯彻下去。
1自动化工作
拒绝重复劳动,能用程序干活的,坚决程序化、平台化;
比如一些机械性重复性的工作,真正的运维工程师绝不能允许自己重复做三遍以上。
如果不能一步到位自动化的话,可以先尝试半自动解决,然后到全自动甚至到智能化的完美方案。
尽量减少需要人为注意的事件,比如发布文件的打包格式,不能依赖人来维护,必须用程序或脚本等技术来解决。
2拒绝重复犯错
人难免会犯错,这是无法避免的。
但是能根据已有的犯错经验,总结犯错的原因以及如何避免同类情况再次发生。
把一些典型的错误在团队中分享,把一个人的犯错得到的经验传播于整个团队。
3凡事有备份、可回退,有plan B;
运维工作中经常有一些发布、迁移、备份等复杂操作,事前最好做全面的操作计划,思考每一步可能的回退与备份。
对每条执行的命令必须double check。
4运维部门做到服务化
别整天喊苦逼、没地位,埋怨没有意义,应该扩大运维部门的影响力。
运维能力的提升不是钻研系统内核、源码就能提升,这是纯技术论,给不了整个公司创造价值的技术是无用的。
对身边同事要有激励和正反馈;凡事有正能量。
5拒绝黑盒运维
深入了解所运维的产品,热爱自己的产品,才能更好的了解它。
深入体验自己运维的产品,知道有哪些细致的体验或者数据可以反映产品的运营质量,这是技术运营需要懂的。