RAID 全攻略
编者按:存储是近年来的一个热点,在整个存储的发展进程中,有一项技术功不可没,它就是 RAID 。上个世纪 80 年代末 RAID 的出现,将存储带进了一个新的时代。从此以后, RAID 在不断发展,渐渐被人们所熟悉,所采用,并渐渐的让人们离不开它。本文将对 RAID 技术进行较为详细的介绍,希望能够对广大读者有所帮助。
RAID 全攻略
计算机制造商们全面打起了提速战。作为计算机最重要的外部存储设备,硬盘当然也不甘落后,相继推出速度更快的硬盘。即便如此,硬盘存储仍然摆脱不了系统性能瓶颈的角色。不仅如此,硬盘存储在数据安全上也是问题多多。现在人们的工作已无法摆脱计算机,这一方面使得人们的工作效率大大提高,但潜在的危险也是明摆着的:一旦硬盘的数据损坏,人们长时间的工作就可能毁于一旦。
那么,有没有基于现在的硬盘提升存储性能和数据安全的技术呢?有,它就是 RAID 技术。
RAID 是由美国加州大学伯克利分校的 D.A. Patterson 教授在 1988 年提出的。 RAID 是 Redundent Array of Inexpensive Disks 的缩写,直译为 “ 廉价冗余磁盘阵列 ” ,也简称为 “ 磁盘阵列 ” 。后来 RAID 中的字母 I 被改作了 Independent , RAID 就成了 “ 独立冗余磁盘阵列 ” ,但这只是名称的变化,实质性的内容并没有改变。简单地讲, RAID 技术就是利用多个硬盘的组合提供高效率及冗余的功能。
RAID 的优点
传输速率高。在 RAID 中,可以让很多磁盘驱动器同时传输数据,而这些磁盘驱动器在逻辑上又是一个磁盘驱动器,所以使用 RAID 可以达到单个磁盘驱动器几倍、几十倍甚至上百倍的速率。这也是 RAID 最初想要解决的问题。因为当时 CPU 的速度增长很快,而磁盘驱动器的数据传输速率无法大幅提高,所以需要有一种方案解决二者之间的矛盾。 RAID 最后成功了。
可以提供容错功能。这是使用 RAID 的第二个原因,因为普通磁盘驱动器无法提供容错功能,如果不包括写在磁盘上的 CRC( 循环冗余校验 ) 码的话。 RAID 容错是建立在每个磁盘驱动器的硬件容错功能之上的,所以它提供更高的安全性。
RAID 比起传统的大直径磁盘驱动器来,在同样的容量下,价格要低很多。
RAID 的级别
具体实现起来, RAID 的级别很多,各级别有着各自的优缺点,用户可以根据不同的需求来选择合适的级别。
RAID 0
RAID 0 需要至少两个硬盘,是没有任何保护的,它只是将两个或多个相同型号及容量的硬盘组合起来,而当系统提取数据时,它可以同时由所有硬盘(同一个阵列里)读出数据,速度会比一个硬盘快得多。而亦因为它没有任何的数据保护,只要其中一只硬盘出事,所有数据便会被破坏。所以 RAID 0 通常应用在一些非重要资料上,如影像撷取。磁盘阵列的总容量为各个硬盘容量之和。
RAID 1
这个级别由两个(只有两个)硬盘组成,亦可称为镜像( Mirroring )。每一个资料均会相同的写在两个硬盘上,镜像就是因为两个硬盘的内容将会一模一样,但对于系统来说都只会见到一个硬盘。当然,资料写入的时间可以会长一点,但读则没有影响,因为两个硬盘是可以同时读取资料的。磁盘阵列的总容量为其中一块硬盘的容量。
RAID 2
RAID 2 又叫纠错海明码磁盘阵列。磁盘阵列中的第一个、第二个、第四个 …… 第 2n 个硬盘是专门的校验盘,用于校验和纠错,例如七个硬盘的 RAID 2 ,第一、二、四个硬盘是校验盘,其余的用于存放数据。使用的硬盘越多,校验盘在其中占的百分比越少。 RAID 2 对大数据量的输入输出有很高的性能,但少量数据的输入输出时性能不好。 RAID 2 很少实际使用。
RAID 3
这个级别需要至少三个硬盘。数据会被分割成相同大小的基带条( stripe )并存放于不同的硬盘上。其中的一个硬盘将会被指定为用来储存校验值,这个校验值是 RAID 卡根据前面硬盘中存放的数据而运算出来,这样当其中一个硬盘有问题时,用户可以更换硬盘, RAID 卡便会根据其他数据重构并存放在新硬盘里。 RAID 3 可以提供高速数据读取,但只针对单用户模式;如果多人同时读取资料, RAID 3 不是理想选择。它更适用于 I/O 传输,而不是大文件传输。因为提供奇偶校验的磁盘常成为瓶颈,所以在没有相应技术的情况下,如回写高速缓存技术,不常使用。如果组成磁盘阵列的硬盘相同,磁盘阵列的总容量为各个硬盘容量之和减去一块硬盘的容量。
RAID 5
这个级别也是需要至少三个硬盘。数据会分割跟 RAID 3 一样,但并不会有一个特定的硬盘将来储存校验值,所有数据及校验值都会分布在所有硬盘上。 RAID 5 消除了 RAID 3 在写数据上的瓶颈,可以提供高速数据读取并针对多用户模式, RAID 5 所提供的功能及表现是有 RAID 级别之中最好的。 RAID 5 常使用缓冲技术来降低性能的不对称性。与 RAID 3 一样,如果组成磁盘阵列的硬盘相同,磁盘阵列的总容量也为各个硬盘容量之和减去一块硬盘的容量。 RAID 5 级以合理的价位提供了最佳的性能和数据安全性,因此目前它很受欢迎。
多层级别 RAID
除了以上的 RAID 级别外,也可以将多个 RAID 级别结合成一个多层级别的 RAID 。在设定一个双层级别( dual-level )的 RAID 时,卡的软件( firmware )会负责将两个或多个单层 RAID 组合成一个多层级别的 RAID 或数组。比较常见的多层级别 RAID 是 RAID 0+1 或称 RAID 0/1 及 RAID 0+5 或称 RAID 0/5 。
RAID 的种类及应用
IDE 和 SCSI 是计算机的两种不同的接口,前者普遍用于 PC 机,后者一般用于服务器。基于这两种接口, RAID 分为两种类型:基于 IDE 接口的 RAID 应用,称为 IDE RAID ;而基于 SCSI 接口的 RAID 应用则相应称为 SCSI RAID 。
以前,一提起 RAID 往往会联想到 SCSI 硬盘,因为它的传统接口一直使用的是 SCSI ,而具有 SCSI 接口的硬盘要比传统的 IDE 硬盘昂贵得多,因此 RAID 技术自产生以来似乎就被定义在了高端 “ 贵族家庭 ” 。在较大的阵列系统中,随着硬盘的数量增多, SCSI RAID 系统的整体造价就明显地提高。与此相反,可以看到被视为低端产品的 IDE 硬盘却具有明显的价格优势,近年来随着 IDE 接口标准的升级, IDE 的传输速度有了明显的提高,串行 ATA 又可加大 IDE 硬盘连接数量,于是 RAID 产品逐步开始渗透到了所谓低端的 IDE 硬盘领域。
与此同时,基于不同的架构, RAID 又可以分为:
● 软件 RAID ( 软件 RAID)
● 硬件 RAID ( 硬件 RAID)
● 外置 RAID (External RAID)
软件 RAID 很多情况下已经包含在系统之中,并成为其中一个功能,如 Windows 、 Netware 及 Linux 。软件 RAID 中的所有操作皆由中央处理器负责,所以系统资源的利用率会很高,从而使系统性能降低。软件 RAID 是不需要另外添加任何硬件设备,因为它是靠你的系统 — 主要是中央处理器的功能 — 提供所有现成的资源。
硬件 RAID 通常是一张 PCI 卡,你会看到在这卡上会有处理器及内存。因为这卡上的处理器已经可以提供一切 RAID 所需要的资源,所以不会占用系统资源,从而令系统的表现可以大大提升。硬件 RAID 可以连接内置硬盘、热插拔背板或外置存储设备。无论连接何种硬盘,控制权都是在 RAID 卡上,亦即是由系统所操控。
在系统里,硬件 RAID PCI 卡通常都需要安驱动程序,否则系统会拒绝支持。磁盘阵列可以在安装系统之前或之后产生,系统会视之为一个(大型)硬盘,而它具有容错及冗余的功能。磁盘阵列不单只可以加入一个现成的系统,它更可以支持容量扩展,方法也很简单,只需要加入一个新的硬盘并执行一些简单的指令,系统便可以实时利用这新加的容量。
外置式 RAID 也是属于硬件 RAID 的一种,区别在于 RAID 卡不会安装在系统里,而是安装在外置的存储设备内。而这个外置的储存设备则会连接到系统的 SCSI 卡上。系统没有任何的 RAID 功能,因为它只有一张 SCSI 卡;所有的 RAID 功能将会移到这个外置存储里。好处是外置的存储往往可以连接更多的硬盘,不会受系统机箱的大小所影响。而一些高级的技术,如双机容错,是需要多个服务器外连到一个外置储存上,以提供容错能力。
外置式 RAID 可以安装任何的操作系统,因此是与操作系统无关的。为什么呢 ? 因为在系统里只存在一张 SCSI 卡,并不是 RAID 卡。而对于这个系统及这张 SCSI 卡来说,这个外置式的 RAID 只是一个大型硬盘,并不是什么特别的设备,所以这个外置式的 RAID 可以安装任何的操作系统。唯一的要求就是你用的这张 SCSI 卡在这个操作系统要安装驱动程序。
产品篇
Adaptec
由于 RAID 的种类很多, Adaptec 公司将众多的 RAID 产品根据不同的服务方向分为三类。
第一类是为工作站设计的低成本的 ATA RAID 卡, IDE 接口的扩展能力不强,所以基于 IDE 的 RAID 的种类也相对少。
第二类是提供高性能的 RAID 卡 —Ultra320 SCSI RAID 等。 Ultra320 解决方案的数据传输速率可达到 320MB/s ,是 Ultra160 产品的两倍,同时还具有信息封包及其他一些关键特性以实现整个系统的高性能、高可靠性和数据完整性。 Ultra320 解决方案为主线存储、视频音频流、视频编辑以及其他对带宽要求很高的应用所设计。
第三类为外部 RAID 子系统。 Adaptec DuraStor 7320SS 是一个从光纤通道到 SCSI 的子系统,它有一个 LUN 分区技术,这种技术为 SAN 领域提供了最高级别的安全和可管理性能。 LUN 分区技术允许网络存储很方便地给特定的服务或者应用分配适当的存储容量,同时还能预防存储空间的不足,可以扩展到 7TB 容量左右。 Adaptec DuraStor 7320SS 附加了 Adaptec's Storage Manager Pro 管理软件,它基于 Java 语言的设计,图形用户界面简化了对远程和本地存储管理,能让用户建立和管理 RAID 阵列,管理软件可以建立用户和管理员不同安全级别,能够检测故障磁盘。
HDS
雷电 9980V 系列内置的虚拟化帮助功能,专门用于帮助您搭建信息平台而设计。这些独特的系统有助于存储资源智能缓冲池的设置和复杂信息平台突破性的简化。主要的功能是实现大量数据系统的合并,灵活的容量配置,顶级的带宽和多连接方式 / 协议的选择。同时降低总拥有成本,带来更快的投资回报。
雷电 9980V 系列以高速的日立第二代 Hi-Star 交换架构为基础,消除了通常由于存储系统合并而带来的停机和瓶颈的风险。多机架的雷电 9980V 系列的性能和可扩展性将引起大量的开放系统、主机系统存储方案的合并,您可以用一个雷电 9980V 系统替换先前所有的存储系统,大大地降低 IT 成本并通过合并存储资源和不同平台间信息的共享让您的投资最大化。
雷电 9980V 系列存储数据的容量可以达到 70TB, 同时允许 UNIX 、 Windows NT/Windows 2000 、 Linux 、 Novell Netware 、 OpenVMS 、 TPF 和 OS/390 互连,对内部的业务运行和您的客户提供高可用性,能够实现多数据系统的合并和存储资源缓冲池,通过虚拟策略实现单一的系统化管理,具有超过 15GB/ 秒的内部系统总带宽,支持导向器、 SAN 、 NAS 或 iSCSI 附件,方便集中管理 SAN 和 NAS ,减少维护费用。
IBM
依靠存储保持快速发展是因为日常的业务流程越来越依靠数据,各公司开始大力发展自己的存储基础设施。但是,如今的公司必须在存储需求和紧张的预算之间作权衡。因此,所采用的解决方案必须经济高效、可扩展,并且能够满足各种存储需求。 IBM TotalStorage FAStT500 存储服务器是一种全光纤的 SAN 解决方案,能够以最合适的价格提供您所需要的性能。
依靠多达 8 个光纤通道直接主机或 SAN 连接, FAStT500 存储服务器提供了快速数据访问能力(高达 383MBps ),特别适合于那些实时性能是关键因素的计算环境。除了高带宽外, FAStT500 还支持各种操作系统,包括 IBM AIX 、 Linux 和 Windows NT 等。
FAStT500 模块化设计使您可以按照需要来购买部件,它可以从 18GB 扩展到使用 22 个扩展柜的 16TB 。每一个 FAStT EXP500 最多支持 10 个光纤通道硬盘驱动器。另外,您还可以采用和选择合适的 RAID 级别,从 0 、 1 、 3 、 5 到 10 ,这样做的目的是为了与应用相匹配或满足用户的特殊经费需要,从而使用户能够扩展和充分利用现有和将来的投资。
TotalStorage FAStT500 解决方案是高度可用的解决方案,能够提供部件发生故障时的安全性。双热插拔 RAID 控制器提供了高吞吐量和冗余度,并且每个控制器支持高达 512MB 的电池备份高速缓存。
FAStT 存储管理器软件使您能够在单个控制台上管理多个 FAStT500 系统。
惠普
高性能 Ultra3 阵列控制器的智能阵列 5300 系列产品能够为惠普 ProLiant 服务器提供可靠的数据保护,同时由于创新的模块化设计和最新的高级数据保护( RAID ADG )技术,该系列产品把灵活性提高到了一个新的水准。智能阵列 5300 控制器通过使用全新的内存体系结构和 RAID 引擎等几项增强型技术,把产品标准提升到更高的性能等级。
RAID ADG ( Advance Data Guarding ),可译为先进的数据保护技术,是惠普 RAID 容错方案,将能解决企业所有的数据损失的问题。 RAID ADG 技术最大特点是部署了两个奇偶校验集,并提供了 2 个硬盘(但不是独立的 2 个校验硬盘)的容量存储这些奇偶校验信息,能同时容忍两块硬盘出现故障,这突破了以往 RAID 级别只允许在同一时刻出现一块硬盘故障的限制,大大提高了企业数据的可靠性。在 RAID 容量超过 2TB 和单个 RAID 卷的总磁盘驱动器达 56 个的时候,该技术实现了错误保护等级的突破。
智能阵列 5300 控制器便于升级的设计允许您根据需要来优化性能并增加容量,信道可以从 2 个增加到 4 个,自备电池的高速缓存可以选择 32MB 、 64MB 、 128MB 或者 256MB ,能够有效保护 ROM 的失败或错误, Ultra3 SCSI 技术可实现更高的性能,每信道的数据带宽最多达 160 MB/s 。同时自备电池的高速缓存,在突然断电、服务器或控制器出现错误时,能够保护缓存内的数据,而且,冗余的、可插拔的电池也实现了更深层的数据保护。最大的缓存配置是 256MB ,备有电池。 66MHz PCI 接口,使带宽的总传输率最高可达 533 MB/s 。
研宇
RAID-500 U3 是一个独立的磁盘阵列子系统,用户能方便快捷地将普通 SCSI 硬盘应用到 RAID 500 系列产品中,可以使用独立的存储子系统提高数据高可用性,在双机热备份的应用中,无论任意一台主机宕机,存储系统均能照常工作。
RAID-500 系列提供几种不同配置,以提高数据可靠性,失效硬盘被新硬盘热插拔 , 系统会动态重新配置并自动重建丢失的数据,而无需重新启动。用户可预先指定空硬盘, RAID-500 能用备用硬盘自动恢复数据热备份。
RAID-500 会自动检测并报告机箱状态,包括电源、风扇失效和机箱过热状态。用户可进行系统设置,使报警通过 Modem 传输到远程主机或呼机上,也可提供服务系统的实时和智能管理。