可靠性:不出事故
可用性: 不出事故 ,出事故后,快速止损
可靠性: 关注系统可以无故障地持续运行的概率,关注的是故障率。
故障的频率越高,可靠性越低。
影响可靠性的因素就是能够引起故障的所有因素,包括软件设计错误,编码错误,硬件故障等等。
可用性: 关注的是服务总体的持续时间。
系统在给定时间内总体的运行时间越长,可用性越高。
在《分布式系统原理与范型》中提到的下面例子中比较准确的解释了两者的区别:
如果系统在每小时崩溃1ms,那么它的可用性就超过99.9999%,但是它还是高度不可靠。
与之类似,如果一个系统从来不崩溃,但是每年要停机两星期,那么它是高度可靠的,但是可用性只有96%。