图书说明:
2016年,Google的网站可靠性工程书引发了行业讨论,讨论了今天运行生产服务的意义 - 以及为什么可靠性考虑是服务设计的基础。现在,参与该畅销书的谷歌工程师介绍了网站可靠性工作手册,这是一个动手实践的伙伴,它使用具体的例子向您展示如何将SRE原则和实践用于您的环境。
这本新工作手册不仅结合了谷歌的经验实例,而且还提供了经历过这一旅程的谷歌云平台客户的案例研究。Evernote,Home Depot,纽约时报以及其他公司概述了来之不易的经验。
深入了解本工作手册,了解如何充实自己的SRE实践,无论您的公司规模如何。
你会学到:
- 如何在您不完全控制的环境(如云)中运行可靠的服务
- 如何通过服务级别目标创建,监视和运行服务的实际应用程序
- 如何将现有的运营团队转换为SRE - 包括如何挖掘运营过载
- 从绿地或棕地开始SRE的方法