如何为海量离线地图数据阵列柜选择一种正确的RAID模式

1. 概述

随着《水经注全国离线地图5.0》升级至5.1与"《水经注全球离线地图2.0》发布的推出,到目前为止已为若干个企事业单位提供了海量离线地图数据,并成功在内网进行离线发布。

由于全国离线数据是由一个16TB与一个8TB机械硬盘进行存储的,因此大家一般情况下也是按照我们目前的存储方式分别提供了两枚硬盘,但当拿到数据硬盘后又会问如何将这两个硬盘合并到一起。

在与客户的沟通过程中,我们了解到有的客户对阵列柜好像并不太了解,不知道居然有这样的神器存在,因此我们觉得有必要为大家分享一下关于阵列柜的相关知识,以及该如何为海量离线地图数据阵列柜选择一种正确的RAID模式等。

当然了,我们分享的内容主要来源于我们公司的数据阵列柜服务商为我们提供的资料(图片来自于网络),在这里特别感谢这位我们长期合作的伙伴。

如何为海量离线地图数据阵列柜选择一种正确的RAID模式

资料来源

2. 阵列柜应用案例

在为大家分享阵列柜知识之前,我们先来看一个武汉的某公司提供的阵列柜应用案例。

最近有一家武汉的某公司,在采购全国离线影像数据时,从网上购买了一个小型阵列柜直接寄到我们公司,如下图所示。

如何为海量离线地图数据阵列柜选择一种正确的RAID模式

客户寄来的阵列柜

该阵列柜共4个盘位,即可以插入合并4个硬盘,如下图所示。

如何为海量离线地图数据阵列柜选择一种正确的RAID模式

4盘位阵列柜

该阵列柜中每个硬盘12TB,因此理论存储大小为48TB,可以完全存储客户需要的"《水经注全国离线地图5.0》升级至5.1"【点击了解】,且还有较多剩余存储空间。

将该阵列柜与连接到我们公司的数据服务器上,如下图所示。

如何为海量离线地图数据阵列柜选择一种正确的RAID模式

将阵列柜接入数据服务器

当然了,我们公司的数据阵列柜也同样连接在这台数据服务器上,这样才能将数据传输到客户的阵列柜上,如下图所示。

如何为海量离线地图数据阵列柜选择一种正确的RAID模式

公司数据服务器与阵列柜

在将"《水经注全国离线地图5.0》升级至5.1"【点击了解】传输到客户的阵列柜之前,还需要先将阵列柜中的4个硬盘做磁盘阵列处理,也就是做Raid模式。

经过与客户沟通之后,为了数据的安全性,我们决定做Raid5模式,致于什么是Raid模式,我们会在后面作分享。

如何为海量离线地图数据阵列柜选择一种正确的RAID模式

确定RAID模式

数据的传输速度大约180M每秒,经过将近两天的时间之后,所有数据全部传输完成,如下图所示。

如何为海量离线地图数据阵列柜选择一种正确的RAID模式

数据传输完成

我们提供的数据目录,依然还是按我们数据原目录格式提供,客户可以自行合并或修改数据的目录结构。

3. 什么是RAID模式

如前文所述,我们将客户提供的数据阵列柜作了Raid5模式,那什么是Raid模式呢?

RAID通常称为磁盘阵列。

磁盘阵列是由很多块独立的磁盘,组合成一个容量巨大的磁盘组,利用多个磁盘提供数据所产生的加成效果提升整个磁盘系统效能。

RAID技术将多个单独的物理磁盘以不同的方式组合成一个逻辑硬盘,根据不同的组织方式可以分为不同的RAID级别。

下面我们将介绍几种常用的磁盘阵列RAID模式,以供大家参考。

4. 磁盘阵列 RAID 0 模式

实现方式:RAID 0最简单的实现方式就是把多块同样的硬盘串联在一起创建一个大的逻辑硬盘。

最大优点就是可以整倍的提高硬盘的容量。

如使用了三块10T的硬盘组建成RAID 0模式,那么磁盘容量就会是30TB。

RAID 0数据恢复:由于不提供数据冗余保护,阵列中某一磁盘发生故障,将导致其中数据丢失,无法恢复。

应用场景:RAID 0 一般适用于对性能要求严格但对数据安全性和可靠性不高的应用,如视频、音频存储、临时数据缓存空间等。

最少硬盘数:创建RAID 0最少需要2块硬盘。

可用容量:磁盘空间利用率为 100%

如何为海量离线地图数据阵列柜选择一种正确的RAID模式

磁盘阵列RAID0模式

5. 磁盘阵列 RAID 1 模式

实现方式:RAID 1使用两组相同的磁盘系统互做镜像,在主硬盘上存放数据的同时也在镜像硬盘上写一样的数据。当主硬盘损坏时,镜像硬盘则代替主硬盘工作。

RAID1数据恢复:如任一磁盘发生损坏,可以马上从镜像磁盘进行数据恢复。如:上图Disk0损坏导致数据丢失,我们可以用新盘替换故障盘,读取Disk1的数据,将其复制到新盘上,从而实现了数据的恢复。

应用场景:RAID 1 应用于对顺序读写性能要求高以及对数据保护极为重视的应用。如:服务器、数据库存储领域。

最少硬盘数:创建RAID 1最少需要2块硬盘

可用容量:实际可用的硬盘为总硬盘数量的一半。

如何为海量离线地图数据阵列柜选择一种正确的RAID模式

磁盘阵列RAID1模式

6. 磁盘阵列 RAID 3 模式

实现方式:RAID 3在阵列中专门有一个磁盘来保存对应分条中其它磁盘数据的奇偶校验信息。

如果某一磁盘数据出错或者故障,可以通过对校验信息的计算恢复出故障磁盘的数据信息。

RAID 3数据恢复:如 RAID3 中某一磁盘出现故障,不会影响数据读取,可以通过对剩余数据盘和校验盘的计算重构故障盘上应有的数据。

如当Disk 0故障,其上面存储的数据A1、A4、B1、B4丢失,数据恢复过程为首先恢复A1,根据同一分条上其它磁盘A2、A3和校验盘上的数据Ap(1-3),进行异或逆运算,得到应有的数据A1。

最后再用相同方法恢复出A4、B1、B4的数据。

应用场景:RAID 3能够为高带宽的大量读写提供高性能,适用大容量数据的顺序访问应用,如视频编辑以及流媒体服务等。

最少硬盘数:创建RAID 3最少需要3块硬盘。

可用容量:实际可用的硬盘=总硬盘数量-1

如何为海量离线地图数据阵列柜选择一种正确的RAID模式

磁盘阵列RAID3模式

7. 磁盘阵列 RAID 5 模式

实现方式:RAID 5 校验数据分布在阵列中的所有磁盘上,而没有采用专门的校验磁盘。

对于数据和校验数据,它们的写操作可以同时发生在完全不同的磁盘上。

RAID 5数据恢复:当RAID 5中某一磁盘故障,在恢复的时候,可利用其它存活磁盘数据进行运算,恢复故障盘上的数据。

应用场景:RAID5 基本上可以满足大部分的存储应用需求,数据中心大多采用它作为应用数据的保护方案。

最少硬盘数:创建RAID 5最少需要3块硬盘。

可用容量:实际可用的硬盘=总硬盘数量-1

如何为海量离线地图数据阵列柜选择一种正确的RAID模式

磁盘阵列RAID5模式

8. 磁盘阵列 RAID 6 模式

实现方式:前面的 RAID 等级都只能保护因单个磁盘失效而造成的数据丢失,如果两个磁盘同时发生故障,数据将无法恢复。

RAID 6引入双重校验的概念,阵列中同时出现两个磁盘失效时,阵列仍能够继续工作,不会发生数据丢失。

RAID 6数据恢复:当有两个磁盘故障时,根据校验数据P和Q恢复出丢失的数据。

应用场景:RAID6 主要用于对数据安全等级要求极高的场合,一般是替代 RAID 10 方案的经济性选择。

最少硬盘数:创建RAID 6最少需要4块硬盘。

可用容量:实际可用的硬盘=总硬盘数量-2

如何为海量离线地图数据阵列柜选择一种正确的RAID模式

磁盘阵列RAID6模式

9. 磁盘阵列 RAID 10 模式

实现方式:RAID 10是将镜像和条带进行组合的RAID级别,先进行RAID 1 镜像然后做RAID 0,适合应用在速度和容错都比较高的场合。

典型应用场景:适合数据量大,安全性要求高的场合使用,如银行等金融领域。

最少硬盘数:创建RAID 10最少需要4块硬盘

可用容量:实际可用的硬盘为总硬盘数量的一半。

如何为海量离线地图数据阵列柜选择一种正确的RAID模式

磁盘阵列RAID10模式

10. 阵列柜中的数据安全保护

为了更好地确保数据的安全,我们可通过热备盘与数据重构等方面对数据进行保护。

热备(Hot Spare):热备盘的作用相当于是在RAID里面再做一个备份,比如说本来RAID里面是只允许坏一个盘的情况下系统和数据依然正常运行,坏两个就不行了,但是加了热备之后就可以同时坏两个盘都没问题,就多了个保险。

热备盘要求和RAID组成员盘的容量、接口类型、速率一致,最好采用同一厂家的同型号硬盘。

重构:RAID阵列中发生故障的磁盘上的所有用户数据和校验数据的重新生成,并将这些数据写到热备盘上的过程。

重构的所有操作都是在不中断系统操作的情况下进行,重建数据时性能会受到较大的影响。

需要注意的是,RAID技术只能解决物理硬盘错误引起的数据丢失问题,比如硬件失效等,而对于人为破坏、病毒和意外删除等非磁盘故障造成的数据丢失会束手无策。

11. 为什么要用磁盘阵列

在了解清楚RAID级别后,我们再来讲为什么要用磁盘阵列。

保障数据安全:无论是机械盘还是固态盘,在使用过程中都会有多方面因素造成硬盘损坏,从而导致数据无法读取。

因此,可以通过磁盘阵列的方式来避免因个别硬盘损坏且导致的数据丢失。

存储空间要求大:目前市面上常见的硬盘,最大的存储空间为16TB单盘,当所要求存储空间>16TB时,就需要用到磁盘阵列了。

目前常见的磁盘阵列可以轻松达到几百TB甚至几PB,可以方便企业数据集中存储,统一管理,防止数据丢失。

对传输速度要求高:受限于硬盘速度,单颗硬盘读写速度有限,而SSD又不适用于重要数据的反复读写。

磁盘阵列可以把多块硬盘叠加,在存储空间叠加的同时,性能也叠加,一台磁盘阵列,轻松达到1GB/S以上的读写速度。

多人访问与协同制作:对应数据有同时访问需求的,可以选用共享阵列,支持Windows及MacOS同时访问,从而可以大大提升工作效率。

灵活权限管理:在大数据时代数据是无价的,目前部分阵列支持读、写、删除、回收站功能,可以灵活设置权限,防止误删除、恶意删除、恶意访问别人数据等情况。

12. 总结

以上从就是对海量卫星影像地图数据存储阵列柜的全部说明,主要包括了阵列柜应用案例,几种常用的RAID模式的区别以及阵列柜中的数据安全保护等说明。

你可以根据实际需求并结合本文分享的内容,为海量离线地图数据阵列柜选择一种正确的RAID模式。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值