RAID阵列的磁盘顺序能否调整?RAID重建需要多久?

643df61e7340ead086c7cd380a7e0174.gif

正文共:1234 字 16 图,预估阅读时间:1 分钟

在之前的使用阵列卡做RAID(Redundant Array of Independent Disks,独立磁盘冗余阵列)的实验中硬件RAID横评(上)硬件RAID横评(下),我们发现:硬件RAID包含RAID卡和主板上集成的RAID芯片,服务器平台多采用RAID卡。RAID卡由RAID核心处理芯片(RAID卡上的CPU)、端口、缓存和电池4部分组成。比如我上一台服务器DL360 Gen9上的P440ar阵列卡和8块SAS盘,又比如我现在这台DL580 Gen9上的P830i阵列卡和5块SAS盘。

得益于阵列卡缓存,相比于软RAID和软硬混合RAID,硬件RAID对CPU的占用率和整体性能是最优的,同时成本也最高的。硬件RAID通常都支持热交换技术,支持在系统运行下更换故障磁盘。

配置RAID阵列主要是通过系统自带的工具,当然,也可以使用单独的工具storcli使用storcli工具配置RAID,收藏这一篇就够了

决定RAID 等级选择因素主要有三,即数据可用性、 I/O性能和成本。现在我使用的两块阵列卡支持的RAID 等级是:RAID 0、RAID 10、RAID 5、RAID 6、RAID 50和RAID 60,之前已经完成对所有等级的容量、性能和安全性测试。

主流 RAID 等级技术对比。

54123c60487c93717e0a937f0915cd16.png

基于P440ar阵列卡和8块SAS盘,对RAID 0、RAID 1和RAID 5进行测试,并模拟硬盘故障,测得磁盘空间、读写速度等数据如下:

80064ab67b3455ddba07e0bc720d6786.png

基于P440ar阵列卡和8块SAS盘,对RAID 6、RAID 50和RAID 60进行测试,并模拟硬盘故障,测得磁盘空间、读写速度等数据如下:

3c245f04631776896a30e8ce0429713c.png

对测试可用的RAID等级进行横向比较,使用绿底标识优选项。

c1d847da6e8bf47fdf2d509e575ec6c4.png

综合看来,RAID 6、RAID 50和RAID 60优势较小。剩余选项中,如果不要求可用性,可以选择配置RAID 0以获得最大空间和最高性能;如果可用性和性能是重要的,而成本不是一个主要因素,则可以根据磁盘数量配置RAID 1。如果可用性,成本和性能都同样重要,则可以选择配置RAID 5,这也是我两台服务器都使用RAID 5的主要原因。

与此同时,针对使用阵列卡配置的硬件RAID,今天补充测试一下配置好阵列卡之后调换顺序是否影响RAID功能。

首先,我们将服务器开机,检查一下RAID状态。

f22ca4ea81b46577713672d76d338eb2.png

可以看到,DL580 Gen9服务器使用P830i阵列卡,阵列卡缓存为2 GiB,配置了RAID 5,磁盘总容量为3725 GiB(1000 GB磁盘的实际空间为931 GiB,使用的进制不一样)。进入系统之后,实际总容量为3.63 TB,约合3717 GB,实际上还是少了一部分的。

f8ea9e4fa3aaf58a3f67b9f2769f856c.png

但是从字节的数量来看,相比于4000 GB的空间,差的就不多了。

我们先使用ATTO进行顺序读写I/O性能测试。

7304c8a163fa9a8ae6739a26259d89a4.png

相比于DL360 Gen9,长字节的读取速度要有明显优势,但是写入速度差了一大截,毕竟DL360 Gen9配置的是8块10000转的SAS盘,DL580 Gen9从数量和转速上都不占优势。

再使用AS SSD进行I/O性能测试。

877dccc5523bba4345b43cad144768a7.png

得分比之前测试的DL360 Gen9稍稍低一点,问题不大。

现在,拔掉服务器第三块硬盘。

fa042fb5f5962390647451e980ac3dbd.png

从iLO查看,显示RAID性能下降,再使用ATTO测试一下顺序读写I/O性能。

ebd6a3f84acede35cafd54f4fa28bb0e.png

读写性能几乎没有差距。再使用AS SSD测试一下I/O性能。

97b4294fdc7c19f78d2746515e7c1bc9.png

顺序读写的得分甚至还高了一点点。

为了模拟真实应用,我们现在复制5 GB的文件,在缓存用尽之后,平均写入速度大概在100 MB/S左右。

241899a2799b69dbac63902e7b2034a8.png

然后,我们将第三块硬盘再插回去。

7ed7e2025bdf29cc898a8331dab86e7c.png

此时,RAID状态变成了“正在重建”。此时使用AS SSD测试一下I/O性能。

6d4b3c2b5b1699b05673de15579e4325.png

性能小有下降,问题不大。

重建过程非常长,我测试了一下,中途关机重启不会影响RAID重建。按照标准计算方式,重建RAID大概需要对整个RAID的数据进行校验,并将数据写入新磁盘进行修复。对于1000的GB的硬盘,单写入数据就需要953674 MB,按照写入速度100 MB/S计算,还需要2小时40分钟。

e2d01dfa0b9a1100199e1b5601bd7fbd.png

实际用时要比这个长一些,大约耗时4.5小时,因为还要考虑RAID执行数据校验计算以生成数据的时间,以及进行重建验证的时间。此外,硬件RAID重建是由阵列卡的处理器来完成的,性能比服务器的CPU要低得多,也会影响RAID的重建时间。

最后,我们将第2块硬盘和第4块硬盘对调一下,看看RAID能不能正常启动。

正常启动,没有任何异常报错。说明更换RAID阵列中磁盘的位置对阵列没有影响。

1cb9aa86f0d199d64fa6e4d77b337895.png

298b72606bbd610078e1dceaca9b360e.gif

长按二维码
关注我们吧

f79863dbbbd8b143ffd4536dd87f6010.jpeg

51c0639a4cae46de38f8420d0b9d1334.png

硬件RAID横评(上)

硬件RAID横评(下)

【更清晰】照片分享,欢迎家庭新成员HPE ProLiant DL580 Gen9

HPE DL580 Gen9到家了,成功开机!

风雨同舟,感谢HP Proliant DL360 Gen9陪我走过的四年

使用Python脚本实现SSH登录设备

一起学习几个简单的Python算法实现

配置VMware实现从服务器到虚拟机的一键启动脚本

奇怪的知识又学到了:服务器的序列号、产品ID和UUID不见了怎么办?

RDP授权119天不够用?给你的Windows Server续个命吧!

成了!Tesla M4+Windows 10+Anaconda+CUDA 11.8+cuDNN+Python 3.11

MX250笔记本安装Pytorch、CUDA和cuDNN

人工智能如何发展到AIGC?解密一份我四年前写的机器学习分享材料

GPU性能测试中的张量和矩阵运算

清华大模型ChatGLM3部署初体验

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Danileaf_Guo

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值