数据可靠性
副本模式下,数据损坏指所有副本在同一时间同时损坏的场景。数据损坏的原因只考虑磁盘故障。机器故障时,如果与磁盘相关则已考虑,如果是网关,cpu 等其他原因,往往数据并没有真正丢失,所以在计算可靠性时不考虑机器故障的场景。
磁盘故障模型
单块磁盘损坏后,其上的所有的 oid 都不可用,对于单块磁盘,如果其在一年中发生故障,认为其故障的概率在所有时间点都是相等的,为均匀分布。
一、单 Oid 可靠性
双副本模式数据丢失场景:oid 的两个副本,分布在两块不同的磁盘上,两块磁盘都发生故障,且发生故障的时间差在 T 以内。
两副本都发生故障的概率为 P2 ,x 表示第一个副本发生故障的时间点(天为单位),y 表示第二个副本发生故障的时间点,(x,y)分布在正方形(0-365, 0-365)内,其中满足两块盘故障时间差在 T 以内也就是 |y−x|≤T 在正方形内围成面积的比例 。
其比例为: 2T365−T23652 , 所以两副本的数据损坏概率为: (2T365−T2