图:任意门运维负责人尤首智
编者按:2021年12月10日,在阿里云云上架构与运维峰会上,任意门(Soul)运维总监尤首智发表了主题为“Soul云上运维架构创新实践”的演讲,和大家交流了Soul云上运维方面遇到的问题、挑战以及在平台化建设过程中的经验分享。
尤首智曾就职于搜狐、奇虎、快手等知名互联网企业,一直从事运维架构、存储、DevOps相关的工作,是一名相关经验非常丰富的“互联网人”。2020年11月加入Soul之后,主要负责运维稳定性及平台化建设,推动DevOps体系落地。本文根据他的演讲整理而成。
一、Soul云上的问题与挑战
在加入Soul之初,我就面临着四个困难和三个亟待解决的问题:
第一、人力短缺。运维部门只有4名同学,研发线只有200个同学,对于一家年轻的公司来说,1:50这个比例是比较高的。
第二、无成型运维工具。工具是存在的,单点上看功能不完备,整体上看运维层面没有串联起来,这大大增加了运维成本。
第三、业务高速迭代。每周一个小版本,两周一个大版本,这与公司业务线的发展体系有关,而且Soul也在不断探索一些新的领域。
第四、基础架构的缺失。这导致接入和使用方式多种多样,每个部门保持自己独立的基础架构,这种工作形态同样也大幅提高了运维成本。
在这些困难下,我们认为,如何短期内提高运维效率,是Soul运维部门当时阶段首要解决的问题。因为只有提升了运维的效率提升,我们才有更多的时间去做更多的事情,包括提升业务的稳定性、更好地支撑业务快速迭代等。
二、运维效率提升
Soul对于运维提效制定了四个主要方向,同时也是我入职后落地工作的重要抓手: