- 博客(1)
- 收藏
- 关注
原创 SRE_Google运维解密_笔记
1.70%的事故由变更引起2.谷歌的SRE倾向于DEVOPS,兼顾效率(快速上线更新)与质量(降低事故率)3.SRE大致发展历程:手动(凭经验容易误操作)→自动→智能4.缓慢的不断重启的实例优于永不重启泄露资源的实例5.SLA(service level agreement):请求延迟;错误率;系统吞吐量(QPS);可用性;持久性SLO(object):SLI的目标范围SLI(indicator):从目标反推指标6.多创新,少做琐事(DRY),但合理的琐事有助于放松7.监控系
2022-10-18 22:09:51 1054
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人