RAID 概念总结

概念

定义

RAID ( Redundant Array of Independent Disks )即独立磁盘冗余阵列,简称为磁盘阵列。
        多磁盘管理技术,通过数据条带、镜像;数据检验等技术,能够提供成本适中、数据可靠性高的高性能存储。
RAID方案常见的可以分为:RAID0、RAID1、RAID5、RAID6、RAID10。
根据RAID类型不同,RAID容量利用率在50%~90%之间。

相关技术

1、镜像
一种冗余技术,保障了数据的可靠性,将同一份数据复制到两块磁盘中,在一块磁盘损坏后,另一块镜像磁盘可以继续工作,确保了外部系统能够正常访问数据,从而保证系统运行,同时在读取数据时可以同时从两块硬盘中并行读取数据,从而提高了数据读的 I/O 性能,但是多块硬盘的数据写入降低了写的 I/O 性能。
优点,一方面提高可靠性,另一方面,并发的从两个或多个副本中读取数据,可以提高读性能。
缺点,相同数据需要同时写入多个磁盘,磁盘的写性能低。

2、数据条带
将数据分片保存在多个不同的磁盘,多个数据分片共同组成了一个完整数据副本。
优点,具有更高的数据并发力度,提高了数据读写速度。
缺点,一份数据分散在多块硬盘中,一块硬盘的损坏将导致整个数据的不可用,增大了数据丢失的概率。
高性能

由于数据条带化技术,数据I/O分散在了各个成员磁盘中,在读写时都是同时与多个磁盘进行交互,实际I/O性能与单块磁盘相比,效率成倍增长。

3、数据校验
在向RAID成员磁盘写入数据的同时,将一份校验数据写入其他的成员磁盘(该数据校验可以存在一块磁盘或分散在多块磁盘中),当某块磁盘的数据出现损坏时,可以根据剩余数据及校验数据进行反检验计算重建丢失的数据。
优点,大程度提高了磁盘整列的可靠性和容错能力。相较于镜像,提高了磁盘空间的利用率;相较于数据条带又提高了数据的可靠性。
缺点,数据校验算法复杂,增加了计算量,会影响系统性能。

方案

RAID0

一种非常简单的的方式,它将多块磁盘组合在一起形成一个大容量的存储。
当我们要写数据的时候,会将数据分为N份,以独立的方式实现N块磁盘的读写,所以这N份数据会同时并发的写到磁盘中,因此执行性能非常的高。
图:RAID0
RAID0 的读写性能理论上是单块磁盘的N倍(仅限理论),实际中磁盘的寻址时间也是性能占用的大头)。
问题
1、它并不提供数据校验或冗余备份,因此一旦某块磁盘损坏了,数据就直接丢失,无法恢复了。
2、因此RAID0就不可能用于高要求的业务中,但可以用在对可靠性要求不高,对读写性能要求高的场景中。

RAID1

原理是在往磁盘写数据的时候,将同一份数据无差别的写两份到磁盘,分别写到工作磁盘和镜像磁盘,那么它的实际空间使用率只有50%了,两块磁盘当做一块用,这是磁盘阵列中单位成本最高的一种方式。
图:RAID1
RAID1其实与RAID0效果刚好相反。RAID1 这种写双份的做法,就给数据做了一个冗余备份。这样的话,任何一块磁盘损坏了,都可以再基于另外一块磁盘去恢复数据,数据的可靠性非常强,但性能就没那么好了。

RAID2

利用海明码数据校验技术,根绝数据宽度的不同需要不同数量的磁盘进行数据校验码的存储,其中第2n位位校验码;即:数据宽度为4时,4块数据盘需要3块校验磁盘(2^3-1 = 4),需要三块校验盘;数据宽度为64时,64块数据盘,需要7块检验磁盘(2^7-1 = 64)
优点:磁盘利用率高于RAID1,同时可靠性有保障
缺点:数据冗余开销太大,而且 RAID2 的数据输出性能受阵列中最慢磁盘驱动器的限制
图:RAID2

RAID3

将数据按照RAID0的形式,分成多份同时写入多块磁盘,但是还会另外再留出一块磁盘用于写「奇偶校验码」。
例如总共有N块磁盘,那么就会让其中额度N-1块用来并发的写数据,第N块磁盘用记录校验码数据。一旦某一块磁盘坏掉了,就可以利用其它的N-1块磁盘去恢复数据。
在这里插入图片描述
风险:
如果一个磁盘出现故障,该磁盘上的 数据可以重建到更换磁盘上;
如果数据尚未重建到更换磁盘上,而此时 又有一个磁盘出现故障,那么阵列中的 所有数据都将丢失。

RAID5

图:RAID5
RAID5也叫奇偶校验,它至少需要3块硬盘,RAID5 应该是目前最常见的 RAID 等级。
RAID5数据以块为单位分布到各个硬盘上。RAID 5不对数据进行备份,也没有采用专门的校验磁盘,而是把数据和与其相对应的奇偶校验信息存储到组成RAID5的各个磁盘上,并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上。
当RAID5的一个磁盘数据损坏后,利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。允许最多同时坏一块磁盘。如果有两块磁盘同时损坏了,那数据就无法恢复了。
  RAID5 兼顾存储性能、数据安全和存储成本等各方面因素,它可以理解为 RAID0 和 RAID1 的折中方案,是目前综合性能最佳的数据保护解决方案。RAID5 基本上可以满足大部分的存储应用需求,数据中心大多采用它作为应用数据的保护方案。

RAID5阵列所有磁盘容量必须一样大,当容量不同时,会以最小的容量为准。 最好硬盘转速一样,否则会影响性能,而且可用空间=磁盘数n-1,Raid 5 没有独立的奇偶校验盘,所有校验信息分散放在所有磁盘上,只占用一个磁盘的容量。
RAID5的磁盘上同时存储数据和校验数据,数据块和对应的校验信息存保存在不同的磁盘上,当一个数据盘损坏时,系统可以根据同一条带的其他数据块和对应的校验数据来重建损坏的数据。与其他 RAID 等级一样,重建数据时, RAID5 的性能会受到较大的影响。

RAID6

RAID6在RAID5的基础上再次改进,引入了双重校验的概念。
RAID6除了每块磁盘上都有同级数据XOR校验区以外,还有针对每个数据块的XOR校验区,这样的话,相当于每个数据块有两个校验保护措施,因此数据的冗余性更高了。
引入双重校验的概念,能够解决两块磁盘都失效的情况,具有更高的容错性。
优点:数据容错性更高。
缺点:实现代价更高,控制器设计更复杂,更昂贵,设计与实施都更复杂,写入性能更差。

但是RAID6的这种设计也带来了很高的复杂度,虽然数据冗余性好,读取的效率也比较高,但是写数据的性能就很差。因此RAID6在实际环境中应用的比较少。

图:RAID6

RAID10

RAID10其实就是RAID1与RAID0的一个合体。
图:RAID10
RAID10兼备了RAID1和RAID0的有优点。首先基于RAID1模式将磁盘分为2份,当要写入数据的时候,将所有的数据在两份磁盘上同时写入,相当于写了双份数据,起到了数据保障的作用。且在每一份磁盘上又会基于RAID0技术讲数据分为N份并发的读写,这样也保障了数据的效率。
但也可以看出RAID10模式是有一半的磁盘空间用于存储冗余数据的,浪费的很严重,因此用的也不是很多。

图:RAID模式对比

参考资源

《RAID磁盘阵列是什么(一看就懂)》
《RAID的种类及介绍》
《RAID基础学习》
《大话存储II----第四章七星北斗–大话/详解七种RAID(4.2)》

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值