RAID
独立硬盘冗余阵列 ( RAID , R edundant A rray of I ndependent D isks ),旧称廉价磁盘冗余阵列 ( RAID , R edundant A rray of I nexpensive D isks ),简称硬碟阵列 。 其基本思想就是把多个相对便宜的硬碟组合起来,成为一个硬碟阵列组,使性能达到甚至超过一个价格昂贵、容量巨大的硬碟。 根据选择的版本不同,RAID比单颗硬碟有以下一个或多个方面的好处:增强资料整合度,增强容错功能,增加处理量或容量。 另外,磁碟阵列对于电脑来说,看起来就像一个单独的硬碟或逻辑存储单元。 分为RAID-0,RAID-1,RAID-1E,RAID-5,RAID-6,RAID-7,RAID-10,RAID-50,RAID-60。
简单来说,RAID把多个硬碟组合成为一个逻辑磁区,因此, 作业系统只会把它当作一个硬碟。 RAID常被用在伺服器电脑上,并且常使用完全相同的硬碟作为组合。 由于硬碟价格的不断下降与RAID功能更加有效地与主机板整合,它也成为了玩家的一个选择,特别是需要大容量储存空间的工作,如:视讯与音讯制作。
最初的RAID分成了不同的等级,每种等级都有其理论上的优缺点,不同的等级在两个目标间取得平衡,分别是增加资料可靠性以及增加存储器(群)读写效能。 这些年来,出现了对于RAID观念不同的应用。
目录
标准RAID
RAID 0
将多个磁碟合并成一个大的磁碟,不具有冗余,并行I/O ,速度最快。 RAID 0亦称为带区集。 它是将多个磁盘并列起来,成为一个大磁盘。 在存放数据时,其将数据按磁盘的个数来进行分段,然后同时将这些数据写进这些盘中,所以在所有的级别中,RAID 0的速度是最快的。 但是RAID 0没有冗余功能,如果一个磁盘(物理)损坏,则所有的数据都会丢失,危险程度与JBOD相当。
理论上越多的磁碟效能就等于「单一磁碟效能」×「磁碟数」,但实际上受限于汇流排 I/O瓶颈及其它因素的影响,RAID效能会随边际递减,也就是说,假设一个磁碟的效能是50MB每秒,两个磁碟的RAID 0效能约96MB每秒,三个磁碟的RAID 0也许是130MB每秒而不是150MB每秒,所以两个磁碟的RAID 0最能明显感受到效能的提升。
但如果是以软体方式来实作RAID,则磁碟的空间则不见得受限于此(例如Linux Software RAID),透过软体实作可以经由不同的组合而善用所有的磁碟空间。
RAID 1
两组以上的N个磁盘相互作镜像 ,在一些多线程操作系统中能有很好的读取速度,理论上读取速度等于硬盘数量的倍数,另外写入速度有微小的降低。 只要一个磁盘正常即可维持运作,可靠性最高。 RAID 1就是镜像,其原理为在主硬盘上存放数据的同时也在镜像硬盘上写一样的数据。 当主硬盘(物理)损坏时,镜像硬盘则代替主硬盘的工作。 因为有镜像硬盘做数据备份,所以RAID 1的数据安全性在所有的RAID级别上来说是最好的。 但无论用多少磁碟做RAID 1,仅算一个磁碟的容量,是所有RAID中磁盘利用率最低的一个级别。
如果用两个不同大小的磁碟建RAID 1,可用空间为较小的那个磁碟,较大的磁碟多出来的空间也可以分割成一个区来使用,不会造成浪费。
RAID 2
这是RAID 0的改良版,以汉明码 (Hamming Code)的方式将数据进行编码后分割为独立的位元,并将数据分别写入硬盘中。 因为在数据中加入了错误修正码(ECC,Error Correction Code),所以数据整体的容量会比原始数据大一些,RAID2最少要三台磁碟机方能运作。
RAID 3
采用Bit-interleaving(数据交错储存)技术,它需要通过编码再将数据位元分割后分别存在硬盘中,而将同位元检查后单独存在一个硬盘中,但由于数据内的位元分散在不同的硬盘上,因此就算要读取一小段数据资料都可能需要所有的硬盘进行工作,所以这种规格比较适于读取大量数据时使用。
RAID 4
它与RAID 3不同的是它在分割时是以区块为单位分别存在硬盘中,但每次的数据存取都必须从同位元检查的那个硬盘中取出对应的同位元数据进行核对,由于过于频繁的使用,所以对硬盘的损耗可能会提高。 (Block interleaving)
RAID 5
RAID Level 5是一种储存性能、数据安全和存储成本兼顾的存储解决方案。 它使用的是Disk Striping(硬盘分割)技术。 RAID 5至少需要三颗硬碟,RAID 5不是对存储的数据进行备份,而是把数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上,并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上。 当RAID5的一个磁盘数据发生损坏后,可以利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。 RAID 5可以理解为是RAID 0和RAID 1的折衷方案。 RAID 5可以为系统提供数据安全保障,但保障程度要比镜像低而磁盘空间利用率要比镜像高。 RAID 5具有和RAID 0相近似的数据读取速度,只是因为多了一个奇偶校验信息,写入数据的速度相对单独写入一块硬盘的速度略慢,若使用「回写快取」可以让效能改善不少。 同时由于多个数据对应一个奇偶校验信息,RAID 5的磁盘空间利用率要比RAID 1高,存储成本相对较便宜。
RAID 6
与RAID 5相比,RAID 6增加了第二个独立的奇偶校验信息块。 两个独立的奇偶系统使用不同的算法,数据的可靠性非常高,即使两块磁盘同时失效也不会影响数据的使用。 但RAID 6需要分配给奇偶校验信息更大的磁盘空间,相对于RAID 5有更大的“写损失”,因此“写性能”非常差。 较差的性能和复杂的实作方式使得RAID 6很少得到实际应用。
同一阵列中最多容许两个磁盘损坏。 更换新磁盘后,资料将会重新算出并写入新的磁盘中。 依照设计理论,RAID 6必须具备四个以上的磁盘才能生效。
可使用的容量为硬盘总数减去2的差,乘以最小容量,公式为Size=(N-2)*min(S1,S2,S3...Sn),同理,数据保护区域容量则为最小容量乘以2。
RAID 6在硬体磁碟阵列卡的功能中,也是最常见的磁碟阵列等级。
混合RAID
JBOD
JBOD( Just a Bunch Of Disks)在分类上,JBOD并不是RAID的等级。 由于并没有规范,市场上有两类主流的做法
- 使用单独的连结端口如SATA、USB或1394同时控制多个各别独立的硬碟,使用这种模式通常是较高阶的设备,还具备有RAID的功能,不需要依靠JBOD达到合并逻辑磁区的目的。
- 只是将多个硬碟空间合并成一个大的逻辑硬碟,没有错误备援机制。
资料的存放机制是由第一颗硬碟开始依序往后存放,即作业系统看到的是一个大硬碟(由许多小硬碟组成的)。 但如果硬碟损毁,则该颗硬碟上的所有数据将无法救回。 若第一颗硬碟损坏,通常无法作救援(因为大部分档案系统将磁碟分割表(partition table)存在磁碟前端,即第一颗),失去磁碟分割表即失去一切数据,若遭遇磁碟阵列资料或硬碟出错的状况,危险程度较RAID 0更剧。 它的好处是不会像RAID,每次存取都要读写全部硬碟。
RAID 7
RAID 7并非公开的RAID标准,而是Storage Computer Corporation的专利硬体产品名称,RAID 7是以RAID 3及RAID 4为基础所发展,但是经过强化以解决原来的一些限制。 另外,在实作中使用大量的快取记忆体以及用以实现非同步阵列管理的专用即时处理器,使得RAID 7可以同时处理大量的IO要求,所以效能甚至超越了许多其他RAID标准的实做产品。 但也因为如此,在价格方面非常的高昂。 [1]
RAID 10/01
RAID 10是先镜射再分割资料,再将所有硬碟分为两组,视为是RAID 0的最低组合,然后将这两组各自视为RAID 1运作。
RAID 01则是跟RAID 10的程序相反,是先分割再将资料镜射到两组硬碟。 它将所有的硬碟分为两组,变成RAID 1的最低组合,而将两组硬碟各自视为RAID 0运作。
当RAID 10有一个硬碟受损,其余硬碟会继续运作。 RAID 01只要有一个硬碟受损,同组RAID 0的所有硬碟都会停止运作,只剩下其他组的硬碟运作,可靠性较低。 如果以六个硬碟建RAID 01,镜射再用三个建RAID 0,那么坏一个硬碟便会有三个硬碟离线。 因此,RAID 10远较RAID 01常用,零售主机板绝大部份支援RAID 0/1/5/10,但不支援RAID 01。
RAID 50
RAID 5与RAID 0的组合,先作RAID 5,再作RAID 0,也就是对多组RAID 5彼此构成Stripe存取。 由于RAID 50是以RAID 5为基础,而RAID 5至少需要3台硬碟,因此要以多组RAID 5构成RAID 50,至少需要6台硬碟。 以RAID 50最小的6台硬碟组态为例,先把6台硬碟分为2组,每组3台构成RAID 5,如此就得到两组RAID 5,然后再把两组RAID 5构成RAID 0。
RAID 50在底层的任一组或多组RAID 5中出现1台硬碟损坏时,仍能维持运作,不过如果任一组RAID 5中出现2台或两台以上硬碟损毁,整组RAID 50就会失效。
RAID 50由于在上层把多组RAID 5构成Stripe,效能比起单纯的RAID 5高,容量利用率比RAID5要低。 比如同样9块硬盘,RAID 50则3个RAID 5组成RAID 0,每个RAID 5会浪费一块硬盘,利用率为(1-3/9),RAID 5则为(1-1/9)。
RAID 53
它拥有一个镜射条带阵列,硬碟里其中一个条带就是一个是由3组以上的RAID 5组成RAID 3硬碟阵列。
RAID 60
RAID 6与RAID 0的组合:先作RAID 6,再作RAID 0。 换句话说,就是对两组以上的RAID 6作Stripe存取。 RAID 6至少需具备4台硬碟,所以RAID 60的最小需求是8台硬碟。
由于底层是以RAID 6组成,所以RAID 60可以容许任一组RAID 6中损毁最多2台硬碟,而系统仍能维持运作;不过只要底层任一组RAID 6中损毁3台硬碟,整组RAID 60就会失效,当然这种情况的机率相当低。
比起单纯的RAID 6,RAID 60的上层透过结合多组RAID 6构成Stripe存取,因此效能较高。 不过使用门槛高,而且容量利用率低是较大的问题。
应用
RAID2、3、4较少实际应用,因为RAID5已经涵盖了所需的功能,因此RAID2、3、4大多只在研究领域有实作,而实际应用上则以RAID5为主。
RAID4有应用在某些商用机器上,像是NetApp公司设计的NAS系统就是使用RAID4的设计概念。
磁碟阵列比较表
RAID等级 | 最少硬碟 | 最大容错 | 可用容量 | 读取效能 | 写入效能 | 安全性 | 目的 | 应用产业 |
---|---|---|---|---|---|---|---|---|
单一硬碟 | (参考) | 0 | 1 | 1 | 1 | 无 | ||
JBOD | 1 | 0 | n | 1 | 1 | 无(同RAID 0) | 增加容量 | 个人(暂时)储存备份 |
0 | 2 | 0 | n | n | n | 一个硬碟异常,全部硬碟都会异常 | 追求最大容量、速度 | 3D产业即时渲染、影片剪接快取用途 |
1 | 2 | n-1 | 1 | n | 1 | 最高,一个正常即可 | 追求最大安全性 | 个人、企业备份 |
5 | 3 | 1 | n-1 | n-1 | n-1 | 高 | 追求最大容量、最小预算 | 个人、企业备份 |
6 | 4 | 2 | n-2 | n-2 | n-2 | 安全性较RAID 5高 | 同RAID 5,但较安全 | 个人、企业备份 |
10 | 4 | n/2 | n/2 | n | n/2 | 安全性高 | 综合RAID 0/1优点,理论速度较快 | 大型资料库、伺服器 |
1. n代表硬碟总数
2. JBOD可接到现有硬碟,直接增加容量
种类
-
软体磁碟阵列(Software RAID)
- 主要由电脑主机板CPU处理阵列储存作业,缺点为耗损较多电脑CPU运算RAID的资源,优点则是价格偏低。 分类有二种:
-
硬体磁碟阵列(Hardware RAID)
- RAID卡上内建处理器,不需伺服器的CPU运算。 优点是读写效能最快,不占用伺服器资源,可用于任何作业系统,也能在系统断电后,透过备份电池模组(BBU, Backup Battery Unit)以及非挥发性记忆体(NVRAM)将硬碟读写日志档(Journal)包含的剩余读写作业先纪录在记忆体中,等待电力供应复原后,再由NVRAM取回日志档资料,接着再完成读写作业,将剩余读写作业安全完成以确保读写完整性。 备份电池模组通常会配合阵列卡的Write-Back快取模式,藉由此记忆体快取读写作业以得到更高的读写效能;但是没有备份电池模组的硬体磁碟阵列卡,切勿使用Write-Back快取模式以免遭遇断电情形导致读写资料流失。 此外,因为硬体磁碟阵列卡搭载CPU处理器,所以可以与系统分离出来,对硬碟进行各种作业,还原作业的速度也比软体磁碟阵列快。 缺点是其售价很高,通常只用于RAID 5和RAID 6。
磁碟阵列相关产品
使用磁碟阵列技术的产品,可依照该产品位于电脑主机中的位置来区分,在电脑主机内部运作的阵列产品,包括了主机板内建的磁碟阵列、磁碟阵列卡;在电脑主机外部运作的阵列产品,则包括硬碟外接盒(别名:磁碟阵列设备)、NAS网路储存设备、硬碟外接座、记忆卡阵列盒。
-
磁碟阵列技术内建于主机板的厂商,常见的有:「英特尔」(Intel)、「超微」(AMD)二家厂商,还有采用Intel晶片组的相关主机板厂商,例如:「华硕」(ASUS)、「技嘉」(GIGABYTE)、「微星」(MSI)、「华擎」(ASROCK)等等。
- 磁碟阵列卡
-
磁碟阵列技术应用于磁碟阵列卡的厂商,常见的有:「艾萨」(LSI)、「峰际科技」(HighPoint)、「HP」、「Adaptec」、「Areca」、「Supermicro」、 「登昌恒兴业」(UPMOST)等等。
-
磁碟阵列技术应用于硬碟外接盒的厂商,常见的有:「艾客优品」(AKITIO)、「大卫肯尼」(CyberSLIM)、「中铵」(ICY DOCK)、「锐铵」( STARDOM)。
- 具备RAID功能的硬碟外接盒,通常也叫「磁碟阵列设备」。
- 硬碟阵列系统
-
磁碟阵列技术应用于磁碟阵列系统的厂商有:「普安」(Infotrend)、「商丞」(Unifosa)、「普桦(现为商丞旗下储存事业群)」(Proware)、「潍进」(Netstor)、「乔鼎」(Promise)、「Sans Digital」、「G-Technology」、「Accusys ExaSAN」(ExaSAN)等等。
- 通常指大型储存系统Rackmount等大容量的机箱,16Bay以上的多层式机箱内,还会配上主机板与CPU成为一个独立的系统。
-
磁碟阵列技术应用于NAS网路储存设备的厂商,常见的有:「群晖」(Synology)、「威联通」(QNAP)、「色卡司」(Thecus)、「凡达克」(Vantec )、「华芸」(Asustor)等等。
-
磁碟阵列技术应用于硬碟外接座的厂商,常见的有:「峰际科技」(HighPoint)、「弘拓」(ONNTO)、「中铵」(ICY DOCK)、「大卫肯尼」( CyberSLIM)等等。
- 记忆卡阵列盒
-
磁碟阵列技术应用于记忆卡的厂商,目前可见的有「信亿」(ARACRD)、「登昌恒兴业」(UPMOST)、「致宇」(Bplus)等等。
磁碟阵列相关客户类型
- 一般消费者备份资料之用、企业建立ERP系统或NAS系统时的重要资料备份。
- 影音多媒体数位内容创作公司、个人影音剪辑数位内容工作室。
- 数位监控系统(DVR)、网路监控系统(NVR)等等需要大量储存影片的监控系统业者,军方、赌场因为需要大量监控系统也是常见使用磁碟阵列的客户。
- 证券、银行等金融行业保管重要客户资料。
参考资料
- ^ RAID Level 7
- ^ OSS LAB网站利用Adaptec公司的说明文件,为软、硬碟RAID提出的说明。 http://www.osslab.com.tw/Storage/Enterprise/SAS与RAID/SAS%2F%2FSATA_HBA资讯/RAID_HBA与架构评述
- ^ Adaptec公司为Hardware/Software RAID提出差异与说明。 http://www.adaptec.com/nr/rdonlyres/14b2fd84-f7a0-4ac5-a07a-214123ea3dd6/0/4423_sw_hwraid_10.pdf