Erasure Code原理

最新推荐文章于 2025-03-16 11:36:13 发布

HeyManLeader

最新推荐文章于 2025-03-16 11:36:13 发布

阅读量2w

点赞数 6

分类专栏： Erasure Code 文章标签： Erasure Code 原理

Erasure Code 专栏收录该内容

3 篇文章

订阅专栏

1.什么是erasure code?

erasure code可以认为是RAID的通式，任何RAID都可以转换为特定的erasure code。在传统的RAID中，仅支持少量的磁盘分布，当系统中存在多个分发点和多节点时，RAID将无法满足需求。比如RAID5只支持一个盘失效，即使是RAID6也仅支持两个盘失效，所以支持多个盘失效的算法也就是erasure code是解决这一问题的办法。( Erasure Code作为可有效提升存储效率、安全性和便捷性的新兴存储技术)

定义：erasure code是一种技术，它可以将n份原始数据，增加m份数据(用来存储erasure编码)，并能通过n+m份中的任意n份数据，还原为原始数据。定义中包含了encode和decode两个过程，将原始的n份数据变为n+m份是encode，之后这n+m份数据可存放在不同的device上，如果有任意小于m份的数据失效，仍然能通过剩下的数据还原出来。也就是说，通常n+m的erasure编码，能容m块数据故障的场景，这时候的存储成本是1+m/n，通常m<n。因此，通过erasure编码，我们能够把副本数降到1.x。

Erasure code 原理 - yandong_8212 - UltraDream

2.使用场景

凡是需要通过冗余来进行高可用的场景。但总体来说，主要运用于存储和数字编码领域。

1) 阵列

如果磁盘阵列需要使用高级特性，比如需要能够容错两个磁盘失效（RAID6），那么可以用n+2的模式；如果想容错4个磁盘失效，则可使用n+4的模式。

2) 云存储

erasure code是云存储的核心技术，最初诸如hadoop, GFS，CEPH等都采用的是n-way replication来做冗余，但是这样会带来极大的成本开销，因此几乎各大公司都在用erasure code替代n-way replication，之后我还会简要介绍一下具体他们使用的模式。

3) P2P领域

erasure code 的理论起码也有20年的历史了，但真正实践可能也就最近几年的时间，在P2P领域，动态的分布和智能的容错，特别是对短暂失效是非常关键的。以往的算法或多或少都有点山寨的感觉，而借助erasure code之后，将会使P2P的算法更具有数学的严谨性。

4) 数字编码

erasure code本身就是出自编码理论，所以在这一块具有先天的优势。

3.Reed-Solomon Codes(最常见的 Erasure Code是 Reed Solomon算法)

erasure code是所有基于之前定义的统称，但具体下来有很多种，其中RS code是最基本的一种。RS codes是基于有限域的一种编码算法，有限域又称为Galois Field，是以法国著名数学家Galois命名的，在RS codes中使用GF(2^w)，其中2^w >= n + m.

RS codes定义了一个(n + m) * n的分发矩阵(Distribution Matrix)