了解SLI、SLO和SLA
概念解释
服务水平指标(SLI)
SLI代表目前服务的状态,例如可以是最基本的接口成功率、p99响应时间,也可以是一些业务指标,例如用户投诉率之类的。是可量化,是可确定的。
服务水平目标(SLO)
SLO是目标,SLO是我们希望将特定的SLI视为健康服务的目标范围。SLO必须定义为给定时间范围内的一个具体值。例如一天内成功率不得低于99.9%。
服务水平协议(SLA)
SLA是签订的协议中包含的SLO,如果未满足该SLA,将受到处罚。也不是所有的公司和业务都需要签订协议。
如何选择合适的指标
选择指标和目标的目的是随时使用客观指标评估团队是否能够利用新功能进行创新,或者稳定性是否有可能降至客户可接受的水平以下,因此需要更多的关注和资源。
以用户体验为中心
定义好的SLI和匹配的SLO,是简洁地解释如何为客户提供愉快的用户体验的核心。如果客户对于两秒内加载页面感到满意,则无须设置750毫秒内加载页面的目标。所以,要找到用户满意的最低标准,例如2s,超过两秒就是不可接受的,那么可以设置SLO为页面加载时间p99不得低于2s。