云存储可靠性的计算方法

本文探讨云存储的可靠性计算,包括数据可靠性和服务可靠性。数据可靠性依赖于硬盘MTBF值和冗余方式;服务可靠性涉及服务器停机时间。计算示例展示了在EC 28 + 4冗余模式下,数据和服务的可靠性分别约为6个9和7个9。结论指出,提升云存储可靠性关键在于增加服务器数量和分散数据。
摘要由CSDN通过智能技术生成

云存储可靠性的计算方法

最近在做云存储EC集群数据可靠性的计算,上网查阅了一下资料,却发现相关的计算方法过于复杂,而且还是错误的。经过了仔细思考以后,捋顺数据可靠性的计算方法。现在在这里写出来,供同样做数据存储的朋友研究。如果有不正确的地方,欢迎指正。

云存储可靠性

我们在说一个云存储的可靠性,一般都会说它的可靠性是多少个9,比如11个9,12个9之类的。就是说,数据存储到这个集群里面,出现问题的概率是1- 0.99…9。这个数值用来表示出现问题的概率非常低。比如3个9,1- 0.999 = 0.0001。出现问题的概率就是万分之一。
从出现问题的位置来看,云存储的可靠性应该从2个方面加以考虑:集群中服务器是否可用,磁盘上面的数据是否损坏。

数据可靠性

我们说数据可靠性,是指硬盘上面的数据出现损坏的概率是多少。这种情况下,服务器可以正常工作,也可以停机。
这个主要是取决于硬盘的MTBF值,磁盘的冗余方式,和盘数目

服务可靠性

这种情况是指服务器停机,不能提高服务,也就是哪怕数据在磁盘上面完好,依然不能提供数据读取的服务。
这个主要取决于服务器停止服务的时间长短

硬盘的MTBF

我们在查看硬盘的参数时,其中很重要的一个参数就是MTBF。就以某捷的硬盘来说,参数表里面这个值就是2500000小时。
MTBF: 硬盘不出现故障的时间间隔。
我们说一个硬盘损坏,总是指在一段时间内损坏
为了衡量,我们设定这个时间是1年。
下面,我们就要计算1年之内,一个硬盘出现故障的概率。
硬盘故障概率 = 1年时间 / MTBF = (24*365)/ 2500000 = 0.35%
所以说一个硬盘1年的故障概率是千分之三点五
经验值是100块盘中,一年之内会坏掉4块。故障率是0.04,比MTBF计算出来的值要高多了

这个很重要,想像一下,如果一个集群里面的硬盘出现故障的概率很高,就很难把数据存储做得非常可靠

计算例子

为了说明存储可靠性的计算方法,我们用一个实际例子做说明。
假设有一个存储集群,里面有10台服务器,每台服务器上面有60个硬盘,采用的数据冗余模式是EC 28 + 4。每个EC数据块都分散到不同的磁盘上面。

数据可靠性的计算

对于一个用户来说,一个数据出现错误,不能恢复的情况,必须是同一个EC组里面的硬盘出现超过4块坏掉,才算是数据损坏。否则就可以通过EC算法把数据恢复回来。这时,一组磁盘32块,这时的数据出现错误的概率k = 0.0035:
y = k 5 ∗ C ( 32 , 5 ) + k 6 ∗ C ( 32 , 6 ) + . . . + k 32 ∗ C ( 32 , 32 ) y 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值