读书笔记(SRE:Google运维解密):第3章 拥抱风险

本文是《SRE:Google运维解密》读书笔记,探讨了追求极致可靠性带来的成本问题,包括冗余资源成本与机会成本。介绍了可用性的计算方式,并强调在正式环境或安全关键系统中,服务风险容忍度需综合考虑多种因素。通过错误预算和服务水平目标(SLO)来平衡创新与可靠性,以管理服务风险,确保与业务需求匹配。
摘要由CSDN通过智能技术生成
  • 极端的可靠性会带来成本的大幅提升:
    过分追求稳定性限制了新功能的开发速度和将产品交付给用户的速度,并且很大程度地增加了成本,这反过来又减少了一个团队可以提供的新功能的数量
     

  • 可靠性进一步提升的成本主要存在于以下两个维度
    (a)冗余物理服务器/计算资源的成本
    (b)机会成本

  • 基于时间的可用性
    可用性=系统正常运行时间/(系统正常运行时间+停机时间)

  • 通过请求成功率来定义服务可用性
    可用性=成功请求数/总的请求数

  • 在一个正式的环境或安全关键的系统中,服务的风险容忍度通常是直接根据基本产品或服务的定义建立的

  • 评价服务风险容忍度时,有许多需要考虑的因素
    (a)需要的可用性水平是什么?
    (b)不同类型的失败对服务有不同的影响吗?
    (c)我们如何使用服务成本来帮助在风险曲线上定位这个服务?
    (d)有哪些其他重要的服务指标需要考虑?

  • 可用性目标
    (a)用户期望的服务水平是什么?
    (b)这项服务是否直接关系到收入(我们的收入或我们的客户的收入)?
    (c)这是一个有偿服务,还是免费服务?
    (d)如果市场上有竞争对手,那些竞争对手提供的服务水平如何?
    (e)这项服务是针对消费者还是企业的ÿ

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值