1.3 数据保护:RAID
为什么使用RAID
- 性能限制,如果驱动器的 MTBF(平均无故障时间) 为 750,000 小时,阵列中有 100 个驱动器,则阵列的 MTBF 变为 750,000 / 100
RAID可以提供的功能:增加容量;高可用性;高性能
RAID的实现:
硬件:通过专用的RAID控制器卡
软件:通过OS或专用软件,主要利用CPU和内存资源,不支持所有RAID级别
数据划分:把读写操作并行分布在多个磁盘驱动器上;如果没有额外的冗余度,任何一个磁盘的失败都会导致读写数据的失败
RAID系统的层
RAID0:磁盘划分
原理:将数据均分存储在阵列上
优点:读写快,没有容量损失
缺点:一个硬盘损坏,所有数据不可恢复
RAID1:磁盘镜像法
原理:每个硬盘都有一个镜像硬盘:存储的内容完全相同
优点:读取性能翻倍;提供完全的数据冗余;其中一块数据丢失可还原
缺点:磁盘利用率低,成本高
RAID2:数据的位交错
原理:RAID0的基础上增加汉明码纠错(发现和修正一位错误)
优点:数据纠错
缺点:成本高,需要额外的盘做纠错
RAID3:具有奇偶校验的驱动器的位交错
原理:使用字节级别的条带化技术,采用专用的奇偶校验盘
优点:能在一个磁盘出现故障时确保数据不丢失,可以重建到更换磁盘上
缺点:如果在重建前又有一个磁盘出现故障,所有数据都将丢失;奇偶校验会消耗系统性能,出现性能瓶颈
RAID4:具有奇偶校验的驱动器的数据扇区交错
原理:和RAID 3 类似,但是对数据的访问从按位访问变成了以数据块(扇区)为单位
RAID5:数据的块交错
原理:综合了RAID 0的条带化技术和阵列数据冗余技术(至少包括三个磁盘)和 RAID 3的奇偶校验,与RAID 3 不同的是将奇偶校验数据分散到每个磁盘中
优点:读写性能高;有校验机制;空间利用率高
缺点:组成的磁盘越多,安全性能越差。连续两块磁盘损坏,所有数据都会丢失
RAID6:双重奇偶校验
RAID10:镜像和条带化的结合
原理:先镜像后条带化,结合了RAID 0和RAID 1的优点。
优点:提供高性能和高冗余。
缺点:成本高,需要至少4个磁盘,存储效率低。
RAID技术演变:LUN虚拟化,块虚拟化
RAID2.0+
硬盘域、存储池、Tier存储层级、DG硬盘组
Chunk 简称CK,存储池内的硬盘空间切分成若干固定大小的物理空间,是组成RAID的基本单位。
Chunk Group简称CKG,是由来自于同一个DG内不同硬盘的CK按照RAID算法组成的逻辑存储单元,是存储池从硬盘域上分配资源的最小单位。
Extent是在CKG基础上划分的固定大小的逻辑存储空间,大小可调,是热点数据统计和迁移的最小单元(数据迁移粒度),也是存储池中申请空间、释放空间的最小单位。