- 服务可靠性建设是一个系统性工程,可以系统性学习了解SRE,它涵盖软件参与环节的方方面面,从硬件到软件,从产品设计到人员培训,从规范到文化等等。
- 100%可靠永远都不是一个正确的可靠性目标。
- 资深的工程师在服务稳定性方面居安思危、殚精竭虑,他们优秀的表现恰恰是核心服务稳定安静地运行。
时间 | 事件 | 备注 |
---|---|---|
2023-03-21 | 数据查询接口升级,因升级前论证测试不充分未发现接口存在性能问题 | |
2023-03-25 | 软件bug | |
2023-03-29 | 机房故障 | |
2023-03-29 | 机房故障 | |
2023-06-08 | 核心设备出现异常 | |
2023-06-19 | 局域网链接故障 | |
2023-06-28 | 追番一直提示获取视频内容失败。 疑似新功能发布过程中出现问题 | |
2023-07-06 | 提示:系统服务错误,原因不详 | |
2023-07-27 | 代码bug | |
2023-09-01 | 上热搜,原因不详 |