云存储可靠性的计算方法

最新推荐文章于 2023-08-09 16:35:36 发布

aaron_2019

最新推荐文章于 2023-08-09 16:35:36 发布

阅读量1.3k

点赞数

分类专栏：存储文章标签：云存储

本文链接：https://blog.csdn.net/aaron_2019/article/details/119831830

版权

本文探讨云存储的可靠性计算，包括数据可靠性和服务可靠性。数据可靠性依赖于硬盘MTBF值和冗余方式；服务可靠性涉及服务器停机时间。计算示例展示了在EC 28 + 4冗余模式下，数据和服务的可靠性分别约为6个9和7个9。结论指出，提升云存储可靠性关键在于增加服务器数量和分散数据。

摘要由CSDN通过智能技术生成

云存储可靠性的计算方法

最近在做云存储EC集群数据可靠性的计算，上网查阅了一下资料，却发现相关的计算方法过于复杂，而且还是错误的。经过了仔细思考以后，捋顺数据可靠性的计算方法。现在在这里写出来，供同样做数据存储的朋友研究。如果有不正确的地方，欢迎指正。

云存储可靠性

我们在说一个云存储的可靠性，一般都会说它的可靠性是多少个9，比如11个9，12个9之类的。就是说，数据存储到这个集群里面，出现问题的概率是1- 0.99…9。这个数值用来表示出现问题的概率非常低。比如3个9，1- 0.999 = 0.0001。出现问题的概率就是万分之一。
从出现问题的位置来看，云存储的可靠性应该从2个方面加以考虑：集群中服务器是否可用，磁盘上面的数据是否损坏。

数据可靠性

我们说数据可靠性，是指硬盘上面的数据出现损坏的概率是多少。这种情况下，服务器可以正常工作，也可以停机。
这个主要是取决于硬盘的MTBF值，磁盘的冗余方式，和盘数目

服务可靠性

这种情况是指服务器停机，不能提高服务，也就是哪怕数据在磁盘上面完好，依然不能提供数据读取的服务。
这个主要取决于服务器停止服务的时间长短

硬盘的MTBF

我们在查看硬盘的参数时，其中很重要的一个参数就是MTBF。就以某捷的硬盘来说，参数表里面这个值就是2500000小时。
MTBF：硬盘不出现故障的时间间隔。
我们说一个硬盘损坏，总是指在一段时间内损坏
为了衡量，我们设定这个时间是1年。
下面，我们就要计算1年之内，一个硬盘出现故障的概率。
硬盘故障概率 = 1年时间 / MTBF = （24*365）/ 2500000 = 0.35%
所以说一个硬盘1年的故障概率是千分之三点五
经验值是100块盘中，一年之内会坏掉4块。故障率是0.04，比MTBF计算出来的值要高多了

这个很重要，想像一下，如果一个集群里面的硬盘出现故障的概率很高，就很难把数据存储做得非常可靠

计算例子

为了说明存储可靠性的计算方法，我们用一个实际例子做说明。
假设有一个存储集群，里面有10台服务器，每台服务器上面有60个硬盘，采用的数据冗余模式是EC 28 + 4。每个EC数据块都分散到不同的磁盘上面。

数据可靠性的计算

对于一个用户来说，一个数据出现错误，不能恢复的情况，必须是同一个EC组里面的硬盘出现超过4块坏掉，才算是数据损坏。否则就可以通过EC算法把数据恢复回来。这时，一组磁盘32块，这时的数据出现错误的概率k = 0.0035：

最低0.47元/天解锁文章

aaron_2019

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
云存储可靠性的计算方法

云存储可靠性的计算方法最近在做云存储EC集群数据可靠性的计算，上网查阅了一下资料，却发现相关的计算方法过于复杂，而且还是错误的。经过了仔细思考以后，捋顺数据可靠性的计算方法。现在在这里写出来，供同样做数据存储的朋友研究。如果有不正确的地方，欢迎指正。云存储可靠性我们在说一个云存储的可靠性，一般都会说它的可靠性是多少个9，比如11个9，12个9之类的。就是说，数据存储到这个集群里面，出现问题的概率是1- 0.99…9。这个数值用来表示出现问题的概率非常低。比如3个9，1- 0.999 = 0.0001。
复制链接

扫一扫