1.副本orEC?
把一个文件放进磁盘很难吗?不难,放进去就是了。
那么如果是特别重要的文件呢?也不难,多放几份就是了。
还记得怎么对待毕业论文的吗,电脑里存一份,U盘里存一份,网盘里再存一份,甚至好几个网盘里都存一份。内心战战兢兢,生怕几个月的努力(并没有。。。)付诸东流。这,就是副本存储。
假设我们的存储是以三副本方式进行的话,我们可以计算出实际利用率是一个很低很低的值,33.3%。那么有没有什么更好的办法呢,有,就是纠删码的方案。
利用纠删码储存文件,一共分三步:
-
把一个文件均分为K个数据块
-
将这K个数据块通过一定的方式联系起来生成M个校验块
-
当某几个数据块丢失时,利用校验块重新计算出丢失的数据块
以K,M取值为5、3为例,可以得出纠删码方案的利用率达到了5/8,62.5。在同样可以容忍丢失三个数据块的情况下,纠删码方案比副本方案容量利用率高出了近一倍!
可以看到重点就在于&#