1.raid的基础知识
传统RAID技术的发展。
在传统的计算机存储系统中,存储工作通常是由计算机内置的磁盘来完成的,
传统内置存储存在诸多问题:
机箱空间限制了硬盘的数量。
不便于扩容,共享和备份
可靠性低,数据丢失的风险大
存储空间利用率低
占用总线资源,影响主机性能。
随着大型计算,海量数据存储不断发展,各类信息化应用对计算能力,数据存储
资源方面都有更高的要求。
为了克服传统内置存储存在的问题,扩展磁盘数量,人们把磁盘从机箱里面挪到
了机箱外面,磁盘阵列技术应运而生。
RAID技术的基本概念
RAID:Redundant Array of Independent Disks,独立冗余磁盘阵列,也称磁盘阵列
RAID:条带化:读写性能好。
磁盘组合:容量扩大
镜像,奇偶校验:数据安全性。
RAID技术实现方式:
RAID实现有两种,即硬件RAID和软件RAID;
硬件RAID:
优点:不占用主机资源,性能高,且操作系统盘也可以安装在RAID虚拟磁盘之上。
能够进行相应的冗余保护。
缺点:成本高。
软件RAID:
优点:成本低,配置灵活,管理方便
缺点:占用主机CPU资源和内存空间,且需启动操作之后才能正常运行。
RAID关键技术-数据组织方式
条带单元:Stripe Unit:指磁盘中单个或多个连续的扇区的集合,是单块磁盘上进行
一次数据读写的最小单元。
条带:是同一磁盘阵列中多个磁盘驱动器上相同"位置"(或者说是相同编号)的
条带单元的集合,条带单元是组成条带的元素。
条带化的数据组织方式,实现了多块磁盘并发/并发存取数据,提高了数据存取
效率。
并发:指多个物理磁盘一对一同时响应多个IO请求。
并行:指多个物理磁盘同时响应一个IO请求。
保护数据的方式:
方法一:镜像方式。
方法二:奇偶校验 。奇偶校验采用异或算法-相同为假,相异为真。
RAID级别与分类标准
RAID技术将多个单独的物理磁盘以不同的方式组合成一个逻辑盘,提高了硬盘
的读写性能和数据安全性,根据不同的组合方式可以分为不同的RAID级别。
2.常见的RAID级别
常用RAID级别:
RAID0
RAID1
RAID3
RAID5
RAID6
RAID10
RAID50
3.RAID0
RAID0数据组织方式:
RAID0:一种简单的,无数据校验的数据条带化技术。
安全性:不提供冗余策略。
性能:数据以条带化形式均匀分布于各个磁盘,支持并发、并行读写。
多个IO写入多个盘,并发。
一个IO写入多个盘,并行。
RAID0不提供数据冗余保护,阵列中的任何一个硬盘失效都将导致整个RAID
组的数据丢失。
优缺点:
RAID0:
优点:
读性能高:支持并发,并行读取。
写性能高:支持并发,并行写入
空间利用率高:100%
缺点:
安全性低,无冗余保护。
最少2块盘,有效容量为所有磁盘容量总和。
RAID0适合于读写性能要求高,但安全性要求不高的应用,如存储高清电源,
图形工作站等。
4.RAID1
RAID1数据组织方式。
RAID1:又称镜像,通过磁盘镜像实现数据冗余的技术。
安全性:全冗余组合模式(镜像备份)
性能:不支持并发/并行写,支持并发、并行读。
每次IO写入都是同时写入两块盘。对于单块盘来说,所有的数据都要写一次。
写入和单块盘一样。
并行读取。
RAID1的数据盘与镜像盘具有相同的内容,当数据盘出现故障时,可以使用
镜像盘恢复数据。恢复时间特别长。
RAID1优缺点:
优点:
读性能高,支持并发并发读取。
安全性高,允许N-1个磁盘故障。
缺点:
写性能差,不支持并发并行写入
空间利用率:N-1个磁盘作为镜像盘。
最小硬盘数2盘。
有效容量:N个磁盘中最小磁盘的容量。
RAID1适用于随机性较大,安全性要求高的应用,如服务器,数据库存储等。
5.RAID3
RAID3基于奇偶校验冗余保护与校验盘的条带化阵列。
安全性:专用检验盘存放冗余数据。
性能:不支持并发写。
校验盘串行写入。
其他盘并发、并行读取。
RAID3通过对剩余数据盘上的数据和校验盘上的校验数据做异或计算,重构出故障盘
上原有的数据。
RAID3优缺点:
优点:
读性能高,支持并发,并行读取。
连续写性能高,支持并行写入。
安全性高:最多允许1个磁盘故障。
缺点:
随机写性能低,不支持并发写入,校验盘瓶颈。
最小硬盘数:3盘。
有效容量:n-1个磁盘容量总和。
不支持多个IO同时写多个盘。(不支持并发)
支持一个IO同时写多个盘。(并行)
RAID3适用于连续数据的存放,安全性要求高的应用,如视频编辑,大型数据库等。
现在使用较少。
6.RAID5
RAID5数据组织方式。
RAID5基于奇偶校验冗余保护机制的条带化阵列,无专用校验盘。
安全性:奇偶校验冗余保护。
性能:支持并发,并行读写。可通过减小"写惩罚"提高性能。
RAID3:校验盘是瓶颈。有专门校验盘。
RAID5:校验盘分布打散在各个磁盘。分布式奇偶校验码的独立磁盘结构。
RAID5:可以通过对其他成员磁盘上的用户数据和校验数据进行异或运算,
重构出故障盘上原有数据。
RAID5优缺点:
优点:
读性能高,支持并发,并行读取。
连续写性能高,支持并行写入 。
安全性高,最多允许故障1块盘。
缺点:
随机写性能适中,支持并发写入但写惩罚较大。
最少硬盘数3盘。有效容量:N-1个磁盘容量总和。
RAID5适用于数据存储,安全性要求高的应用,如邮件服务器,文件服务器等。
7.RAID6
RAID6:P+Q :P和Q代表两个彼此独立的校验数据。
RAID6 P+Q磁盘阵列对数据的读写方式与RAID5同理。
RAID6P+Q数据保护。
阵列中只有一个磁盘数据丢失时,根据P校验公式或Q校验公式即可恢复失效磁盘
上的数据,与RAID5同理。
阵列中同时有两个磁盘数据丢失时,则需要两个校验公式,求解方程组实现
数据的恢复。
RAID6 DP工作原理:
RAID6 DP:P和DP代表两个校验数据,分别使用横向校验方式和斜向校验方式算得。
RAID6 DP磁盘阵列对数据的读写方式和RAID3同理。
阵列中同时有两个磁盘数据丢失时,则需要两个校验公式实现数据恢复。
RAID6优缺点:
优点:
读性能高,支持并发,并行读取。
连续写性能较高,支持并行写入
安全性非常高,最多允许故障2块盘。
缺点:
随机写性能适中,双重校验写惩罚较大。
最小硬盘数4盘。
有效容量:N-2个磁盘容量总和。
RAID6适用于安全性要求非常高的应用。
8.RAID01 与RAID10
RAID01 与 RAID10 数据组织方式。
RAID01 :组内做RAID0,组件做RAID1,实质是对条带化后的虚拟磁盘实现镜像。
安全性:镜像冗余保护 。最少4盘,只允许坏一块盘。
性能:支持并发,并行读写。
RAID10:组内做RAID1,组件做RAID0,实质是对镜像后的虚拟磁盘实现条带化。
安全性:镜像冗余保护。最少4盘,允许坏2块盘。
性能:支持并发,并行读写。
实际使用RAID10;
四盘的RAID10组中,位于不同RAID 1组的两个磁盘同时损坏,整个逻辑磁盘仍能
恢复数据和正常工作。
RAID10优缺点:
优点:
读性能高,支持并发并行读取
写性能高,支持并行并发写入
安全性高,最多允许故障2块盘。
缺点:
空间利用率低,50%。
最小硬盘数4盘。有效容量 N/2个磁盘容量总和。
RAID10适用于数据量大,安全要求高的应用,如银行,金融等领域的数据存储。
9.RAID50
RAID50 提高RAID10的磁盘利用率。
RAID50数据组织方式。
RAID50:组内做RAID5,组间做RAID0;
安全性:奇偶校验冗余保护。
性能:支持并发,并行写入。
6盘的RAID50组中,位于不同RAID5组的两个磁盘同时损坏,整个逻辑磁盘仍能
恢复数据和正常工作。
RAID50:
优缺点:
优点:
读性能高,支持并发,并行读取。
连续写性能适中,支持并行写入。
安全性高,最多允许故障2块盘。
缺点:
随机写性能适中,支持并发写入,写惩罚大。
最小磁盘数6盘。有效容量N*6-2;
RAID50适用于随机数据存储,安全性要求高,并发能力要求高的应用,
如邮件服务器,WWW服务器。
实际使用较多的为:RAID10,RAID5,RAID6,RAID50;
10.总结
虽然RAID的方式有很多种,但是在金融领域中,常用的还是RAID5和RAID10;
既能保证性能也能满足安全特性。