磁盘阵列设备的选型与选购(一)

磁盘阵列模式的选型

在RAID技术中,分为几种不同的阵列模式,它们对整个服务器磁盘读写和数据安全保护性能都不一样。具体如何选择,同样需要根据相应企业的网络规模和应用需求而定,而不能一味地追求高性能。本节先来回顾一下RAID的几种模式(俗称“RAID级别”)。

1.JBOD模式

JBOD(Just Bundle of Disks,简单磁盘捆绑),通常又称为Span。其实JBOD并不是真正意义上的RAID模式,只是在近几年才被一些厂家提出,并被广泛采用的。也有人把它归为串联式的RAID 0,因为其目的纯粹是为了增加硬盘的容量。

Span是在逻辑上把几个物理磁盘一个接一个串联到一起,从而提供一个大的逻辑磁盘。 Span上的数据简单地从第一个磁盘开始存储,当第一个磁盘的存储空间用完后,再依次从后面的磁盘开始存储数据。存储原理如图7-3 7所示。Span存取性能完全等同于对单一磁盘的存取操作,也不提供数据安全保障,只是简单地提供一种利用磁盘空间的方法。其存储容量等于组成span的所有磁盘容量的总和。

 

2·RAID 0(无差错控制的条带化阵列)

RAID 0又称为Stripe(条带化)或Striping,是所有RAID规格中速度最快但可靠性最差的磁盘阵列模式,因为RAID 0不仅可以将多块磁盘连接起来形成一个容量更大的存储设备,而且还可以获得成倍数级增长的性能提升。如连接的是两块磁盘,则性能为单磁盘的两倍,如果连接的是3块,则性能是单磁盘的3倍,但通常最多只能连接4块磁盘,所以最高可提高磁盘读写性能到单磁盘的4倍。

与串联式JBOD模式的读写顺序不同,并行模式的RAID 0在读写时可同时对多个磁盘进行并行操作。写入时,数据会以设定的交叉存储区域(带区集,Striping)的大小为单位均匀分割成等量的数据块,然后被分别存放到几个磁盘中;而在读取时,目标数据则被同时从多块磁盘中同时取出并经控制器组合成完整的文件。

在这种磁盘阵列中,数据条带按系统规定的“段"为单位依次写入多个磁盘,例如,数据段A写入磁盘O,段B写入磁盘1,段C写入磁盘2等,依此类推。当一个数据条带最后一个数据段在最后一个磁盘中写完后,再返回到磁盘1的下一可用磁盘空间继续写下一个数据条带,依此类推,直到本次所存数据全部存储完毕。存储原理如图7-38所示。

 

由于采用了磁盘分段的方法,分割数据可以将I/O负载平均分配到所有的驱动器中,是把数据立即写入(读出)多个磁盘,因此它的速度比较快,使得性能显著提高。实际上,数据的传输是有顺序的,但多个读(或写)操作则可以相互重叠进行。这就是说,正当段1在写入磁盘O时,段2写入磁盘1的操作也开始了;而当段2还在磁盘1进行写入操作时,段 3数据已送到磁盘2;依此类推,在同一时刻则可以有几个磁盘(甚至是所有磁盘)在同时写数据。因为数据送入盘驱动器的速度要远大于写入物理盘的速度。理论上性能可以提高n一1 倍(n为阵列磁盘数),目前这一阵列模式最多可连接4个磁盘,所以最高可提高性能3倍。

但是,RAID 0却没有数据保护能力,可靠性仅为单磁盘系统的1/n。如果一个磁盘出现故障,那么数据就会全盘丢失,因为它并没有采取数据冗余措施。例如,假使一个文件的段 A(在磁盘O),段B(在磁盘1),段C(在磁盘2),则只要磁盘O、1、2中有一个产生故障,就会引起问题;如果磁盘1产生故障,则我们只能从磁盘物理地取得段A和段C的数据,中间段B的数据就不能恢复了。因此,RAID 0不适用于关键任务环境,但非常适合于视频、图像的制作和编辑。

3.RAID 1(镜像结构)

如果说RAID 0为了取得高性能而牺牲了安全性,那么RAID 1便恰好相反。RAID 1的设计目的是打造一个安全性极高的存储系统。简言之,它是用一个磁盘作为主磁盘的实时镜像,以确保在主磁盘出现故障时能及时从镜像磁盘中得到恢复,提高了数据存储的安全性。但也因此而损失了至少一半容量——镜像磁盘只能够作为主磁盘的备份,真正有效的容量只能单单依靠一个主磁盘。

RAID 1也被称为“镜像",因为它是将一个磁盘上的数据完全复制到另一个磁盘上,百分之百地实现数据冗余。可以说它是走向RAID 0的另一个极端。我们知道,RAID 0只考虑了增加磁盘容量和提高磁盘读写性能,但却没有采取任何数据冗余措施,使得RAID 0没有任何数据安全保障,一旦阵列中的某一个磁盘出现了故障,则整个阵列中的数据都可能遭遇破坏,不能恢复。而此处的RAID 1则采取了1 00%的数据冗余,把阵列中的其中一个磁盘上的数据全部动态复制下来。这样即使其中一个磁盘发生故障,数据仍能完整地进行数据恢复。但它却不能提高磁盘容量,也不能提高磁盘读写性能,因为数据在同一时刻仍只是写入一个磁盘中。RAID 1实现的原理如图7-3 9所示。由此可见,RAID 1的优点就是可以提供1 00%的数据冗余,数据安全比较有保障。但RAID 1的缺点是不能提高磁盘读写性能,而且磁盘利用率低,只有5 0%。相对来说成本也就要比单个无冗余磁盘贵一倍,因为必须购买另一个磁盘用作第一个磁盘的镜像。RAID 1可以由软件或硬件方式实现,也是需要两块磁盘。

 

4.RAID 2 (帝海明码校验)

前面介绍的RAID 0磁盘分段改善了磁盘子系统的性能,因为向磁盘读写数据的速度与磁盘子系统中磁盘数目成正比地增加,但它的缺点是磁盘子系统中任一磁盘的故障都会导致整个计算器系统失败。在RAID 1中,是把整个分段的磁盘子系统用作镜像,如果已经用了4 个磁盘进行分段,我们可以再增加4个分段的磁盘作为原来4个磁盘的镜像,很明显这是昂贵的(虽然可能比镜像一个昂贵的大磁盘来得便宜)。是否可以不用镜像而用其他数据冗余的方法来提供高容错性能呢?经过专家们的研究,最终发现有一种神奇偶码模式可以达到目的,可以外加专用奇偶校验盘(女~I RAID 2和RAID 3中),或者把奇偶校验数据分散分布在磁盘阵列的全部磁盘中,也就是采用分布式奇偶校验数据(如 RAID 5)。

RAID 2是为大型机和超级计算机开发的带海明码校验磁盘阵列,这主要是由这种级别的 RAID特点决定的。因为在这种RAID模式中,磁盘驱动器组中的第1个、第2个、第4个…… 第2的耽次幂个磁盘驱动器是专门的校验盘,用于校验和纠错,余下的才用于数据存储,磁盘利用率相当低。如图7-40所示结构中:7个磁盘驱动器组建的RAID 2,第1、2、4个磁盘驱动器是纠错盘,其余的用于存放数据。

 

由于有多个磁盘是专门用于校验,所以磁盘的利用率比较低,而且是磁盘组中磁盘数越少,磁盘的利用率越低。RAID 2对大数据量的读写具有极高的性能,但少量数据读写时性能反而不好,所以RAID 2实际使用较少。RAID 2所需的磁盘数至少是3块。

5.RAID 3(带奇偶校验码的并行传送)

RAID 3为带有专用奇偶位(parity)的条带,是RAID 0的一种改进RAID模式,但它也采用了上述介绍的RAID 2模式中的奇偶校验技术。在每个条带片上都有相当于一“块"那么大的空间用来存储冗余信息,即奇偶位。也就是相对于RAID 0中的“条带"来说多了一个存储奇偶校验位的“块",需要专门一块磁盘来存储,如图7-4 1所示。奇偶位是编码信息,如果某个磁盘的数据有误,或者磁盘发生故障,就可以用它来恢复数据。在数据密集型环境或单一用户环境中,组建RAID 3对访问较长的连续记录有利。

配置这种RAID 3所需的磁盘数至少3块。

 

6·RAID 4(带奇偶校验码的独立磁盘结构)

RAID 4也是带奇偶校验码的独立磁盘结构,与RAID 3很相似,不同的是RAID 4对数据的访问是按数据块进行的,也就是按磁盘进行的,每次是一个盘。RAID 3是一次一横条(条带),而RAID 4一次一竖条。所以RAID 3常需访问阵列中所有的磁盘驱动器,而RAID 4只零访问有用的磁盘驱动器,这样读数据的速度大大提高了。但在写数据方面,需将从数据磁盘驱动器和校验磁盘驱动器中恢复出的旧数据与新数据校验,然后再将更新后的数据和检验位写入磁盘驱动器,所以处理时间较RAID 3长。

配置这种RAID 4也必须至少有3块磁盘。

7.RAID 5(带分布式奇偶校验的独立磁盘结构)

RAID 5被称为“带分布式奇偶位的条带",是目前应用最广的一种磁盘阵列方式。它与 R.AID 3比较类似,每个条带上也都有相当于一个“块’’那么大的地方被用来存放奇偶位。但与RAID 3不同的是,RAID 5把奇偶位信息随机地也分布在所有的磁盘上,而并非单独用一个磁盘来存储(如图7-42所示),这样可大大减轻奇偶校验盘的负担。

 

RAID 5的读出效率很高,写入效率一般,块式的集体访问效率不错。因为奇偶校验码在不J司的磁盘上,所以提高了可靠性。但是它对数据传输的并行性解决不好,而且控制器的设计也相当困难。RAID 3与RAID 5相比,重要的区别在于RAID 3每进行一次数据传输,需涉及到所有的阵列盘。而对于RAID 5来说,大部分数据传输只对一块磁盘操作,可进行并行操作。在RAID 5中有“写损失",即每一次写操作,将产生4个实际的读/写操作,其中两次读旧的数据及奇偶信息,两次写新的数据及奇偶信息。

RAID 5级别尽管有一些容量上的损失,但却能提供较为完美的整体性能,既可有相当程擘上的磁盘读写性能和容量上的提高,同时又提供了一定程度上的数据安全冗余,因而也是被广泛应用的一种磁盘阵列方案。它适合于输入/输出密集、高读/写比率的应用程序,如事务处理等。

配置这种RAID也必须至少有3块磁盘。

8·RAID 6(带有两种分布存储的奇偶校验码的独立磁盘结构)

RAID 6是带有两种分布存储的奇偶校验码的独立磁盘结构,是使用了分配在不同的磁盘上的第二种奇偶校验的增强型RAID 5,如图7-43所示。不过由于它的配置过于复杂,所增加的第二个奇偶校验并不是很实用,所以实际应用很少见。

 

很明显RAID 6的优点就是由于采取了两种奇偶校验方法,增强了数据冗余能力,所以它能承受多个驱动器同时出现故障,数据安全更有保障。RAID 6的缺点相比来说更为明显:首先,由于引入了第二种奇偶校验,所以整个磁盘阵列的磁盘利用率比RAID 5还要低(至少需要4块磁盘);其次,两种奇偶校验,用于计算奇偶校验值和验证数据正确性所花费的时间和系统资源比较多,造成了系统的负载较重,大大降低整体磁盘性能;最后,系统需要一个极为复杂的RAID控制器。正因有这么多不足之处,所以它并没有得到多少实际应用。

9.RAID 7(优化的高速数据传送磁盘结构)

RAID 7自身带有智能化实时操作系统和用于存储管理的软件工具,可完全独立于主机运行,不占用主机CPU资源。

RAID 7存储计算机操作系统(Storage Computer Operating System)是一套实时事件驱动操作系统,主要用来进行系统初始化和安排RAID 7磁盘阵列的所有数据传输,并把它们转换到相应的物理存储驱动器上。通过存储计算机操作系统来设定和控制读写速度,可使主机I/0 传递性能达到最佳。如果一个磁盘出现故障,还可自动执行恢复操作,并可管理备份磁盘的重建过程。

RAID 7采用的是非同步访问方式,极大地减轻了数据读写瓶颈,提高了I/O速度。所谓非f司步访问,即RAID 7的每个I/0接口都有一条专用的高速通道,作为数据或控制信息的流通路径,因此可独立地控制自身系统中每个磁盘的数据存取。如果RAID 7有Ⅳ个磁盘,那么除去一个校验盘(用作冗余计算)外,可同时处理Ⅳ-1个主机系统随机发出的读/写指令,从而显著地改善了I/O应用,如图7-44所示。

 

RAID 7系统内置实时操作系统还可自动对主机发送过来的读/写指令进行优化处理,以智能化方式将可能被读取的数据预先读入快速缓存中,从而大大减少了磁头的转动次数,提高了I/O速度。RAID 7可帮助用户有效地管理日益庞大的数据存储系统,并使系统的运行效率提高至少一倍以上,满足了各类用户的不同需求。但配置相当复杂,成本高,在实际应用中也比较少见。

1 O.RAID 1 0(RAID 0+1) (高可靠性与高效磁盘结构)

丽面介绍的RAID 0虽然有高性能,但安全性差,而RAID 1刚好相反,能否把两者结合起来呢?这便产生了二者的综合体~RAID 0+1模式(也被称为“镜像阵列条带”)。

RAID 0+1既具有RAID 0的高性能又具有RAID 1的安全性,而实现RAID 0+1模式的方法是将两组RAID 0的磁盘阵列互为镜像,形成一个RAID 1阵列,这样每次写入数据时, RAID控制器会将数据同时写入两组RAID 0阵列中,如图7-45所示。尽管RAID 0+1兼具 RAID 0高性能和RAID 1高安全性的优点,但它至少需要4个硬盘,成本巨大,而且容量利用率也只有5 0%,普通用户是绝对无法承受的,目前多见于既要求高性能又要求安全性的视频服务器系统中。

 

11.RAID 30

RAID 3 0也被称为“专用奇偶位阵列条带"。它具有RAID 0和RAID 3的特性,由两组 RAID 3的磁盘(每组3个磁盘)组成阵列,使用专用奇偶位,而这两种磁盘再组成一个RAID0 的阵列,实现跨磁盘抽取数据,如图7-46所示。

 

RAID 3 0提供容错能力,并支持更大的卷容量。像RAID 1 0一样,RAID 3 0也提供高可靠性,因为即使有两个物理磁盘驱动器失效(每个阵列中一个),数据仍然可用。 RAID 3 0至少要有6个磁盘,配置成本较高,磁盘利用率也较低,所以实际应用中也比较少见。它最适合非交互的应用程序,如视频流、图形和图像处理等。这些应用程序顺序处理大型文件,而且要求高可用性和高速度。

12.RAID 50

RAID 5 O被称为“分布奇偶位阵列条带",与RAID 3 O类似,但它是同时具有RAID 5 和RAID O的共同特性。它由两组RAID 5磁盘组成(每组最少3个磁盘),每一组都使用了分布式奇偶位,而两组RAID 5磁盘再组建成RAID O模式,实现跨磁盘抽取数据,如图7—47 所示。

 

图7.47 RAID 50存储原理 RAID 50提供可靠的数据存储和优秀的整体性能,并支持更大的卷容量。即使两个物理磁盘发生故障(每个阵列中一个),数据也可以顺利恢复过来。

RAID 50最少需要6个驱动器,它最适合需要高可靠性存储、高读取速度、高数据传输性能的应用。这些应用包括多事务处理和有许多用户存取小文件的办公应用程序。

以上各种RAID模式的综合对比如表7—2所示。

表7—2 RAID模式比较

RAID模式 RAID O RAID l RAID 2 RAID 3 RAID 4 RAID 5 名称 条带阵列 镜像阵列 带海明码校验
磁盘阵列 专用校验条带
阵列 专用校验条带
阵列 分散校验条带 允许故障 否 是 是 是 是 是 冗余类型 无 副本 校验 校验 校验 校验 热备用操作 不可 可以 可以 可以 可以 可以 磁盘数量 两块以上 两块以上(偶
数) 3块以上 3块以上 3块以上 3块以上 可用容量 最大 最小 较少 中间 中间 中间 减少容量 无 50% 不定 1个磁盘 1个磁盘 1个磁盘 读性能 高(盘的数量
决定) 中间 大数据量高,小
数据量低 高 高 高 安全性 最差 最好 较好 好 好 好 典型应用 无故障的迅速
读写 允许故障的小
文件、随机数据
写入 大容量数据存
储 允许故障的大
文件、连续数据
传输 允许故障的大
文件、连续数
据传输 允许故障的小
文件、随机数
据传输

 

RAID模式 RAID 6 RAID 7 RAID 10 RAID 30 RAID 50 名称 分布存储的奇偶校验码
独立磁盘结构 优化的高速数据
传送磁盘结构 跨越镜像阵列 跨越专用校验阵列 跨越分散校验
阵列 允许故障 是 是 是 是 是 冗余类型 校验 校验 副本 校验 校验 热备用操作 可以 可以 可以 可以 可以 磁盘数量 4块 3块以上 4块以上 6块以上 6块以上 可用容量 较小 较高 最小 中间 中间 减少容量 每个阵列两个磁盘 每个阵列中1个
磁盘 50% 每个阵列中1个磁盘 每个阵列中1
个磁盘 读性能 较低 较高 中间 好 高 安全性 好 较好 较好 较好 好 典型应用 数据安全性较高的应用 大容量复杂数
据存储 允许故障高速
度小文件、随机
数据写入
允许故障高速度大文
件、连续数据传输 允许故障高速
度小文件、随
机数据传输

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值