门槛低、晋升慢、oncall长是人们对运维的刻板印象。因此很多程序员对这一岗位嗤之以鼻——不就是个“高级网管”嘛?
好在Google站出来为运维正了名,“网管”终于成功上位工程师。
Google的运维又叫SRE(Site Reliability Engineer),它不只要做Operation方面的工作,更重要的是保障整个企业服务的稳定性。因此,与SWE(Software Engineer)相比,SRE的地位不降反升,是大多数运维工程师趋之若鹜的对象!
《面试软技能指导 - BQ/Resume/Project 2020 版》
试听内容:
- 除了刷题,还有哪些技能是拿到offer不可或缺的要素
- 如何提升面试软实力:简历, 行为面试,沟通能力
- 现场模拟面试 - Dealing With Ambiguity
免费试听时间:
北京时间 10月19日 周一 09:30
美东时间 10月18日 周日 21:30
美西时间 10月18日 周日 18:30
谷歌SRE成业界典范
SRE这个概念也是谷歌最早提出来的,狗家的SRE也是最高端的技术工种之一。
尤其是DevOps的流行,给运维带来了新的活力和更大的空间。用程序去自动化一部分系统,包括自动化代码构建、部署流程、监控等等的工作。
虽然说国外大厂像Facebook、Twitter都有自己的运维体系,但论逼格,谷歌绝对是独领风骚!目前谷歌的SRE分SRE Software Engineer和SRE System Engineer,两者在面试内容和流程上有一定差异:
- SRE Software Engineer的面试和SWE比较像,都要考数据结构和算法,语言可任选,但是会带一些Unix/Linux系统的问题。在onsite轮里,这个岗位还需要进行Non-Abstract Large System Design。
- SRE System Engineer就完全是运维相关的面试了,不考算法,而会问Unix/Linux系统相关的问题,onsite还要进行troubleshooting。
技术含量不低,地位比SWE还高?
的确,很多人认为SRE不要求很高的技术水平,日常工作也只负责简单地进行系统维护,所以“低SWE一等”。
这完全就是误区!
首先,运维是每个公司必不可少的岗位,公司的规模越大,对SRE的要求就越高——既要熟悉各种系统管理工具,又要处理庞大数据库的保养,此外,还要保证服务高SLA(Service-level Agreement)。
其次,谷歌SRE的工作比较多涉及分布式系统以及Infra,需要support每一个部分,所要求的技术水平一点都不低,有可能你要懂的东西比普通SWE还要多!
再看薪资方面,谷歌SRE和SWE的package相差不多。更重要的是,SRE不仅要对server做大量的调优,有时候连SWE写的程序代码,也要SRE审核同意之后才能发布上线。所以谷歌SRE的地位相当高!
Oncall压力小,还能换带薪假
谷歌SRE并不用时刻oncall,一般运维团队会有一半在欧洲,跟北美总部保持一定时差。这样就能保证24小时都有人在线应对突发状况,还能大大减轻单个工程师的oncall压力。
不过当系统故障的时候,SRE还是要oncall处理突发情况。Google规定,只要是oncall,就能补贴PTO(即带薪假期 Paid Time Off),也就相当于调休。
另外,SRE整组每年都会meet一到两次,谷歌会将不同地区的员工聚集到一起“公费旅游”,头等舱+豪华酒店,是不是很心动呢?
面试和SWE一样!巨头都在抢
谷歌的SRE员工数量较多,体系也相对完善。SRE Software Engineer和SWE属于同一个ladder,在公司内部可以进行自由换组。不过SRE System Engineer则要进行额外的算法面试。
因为谷歌很多组都有SRE的hc需求,所以申请这个岗位的最大好处是可以先拿offer再match组。
现在在很多公司,SRE都是必备岗位,这个岗位的工作多多少少会与SWE相关,所以不用担心自己会成为一个高级网管。相反地,这也是一种“曲线上岸”的办法!
(来源:LinkedIn)