大容量疯了!居然想把磁带放到硬盘,100TB+是否可以实现?

1.引言

上一篇关于大容量硬盘的文章(HDD最后的冲刺:大容量硬盘的奋力一搏)中,我们针对大容量硬盘研发状态,小编最近又有了新发现。WDC希望可以通过HDD和磁带结合,把盘的容量提升到100TB+

2.数据大爆炸的时代

首先,我们先来看一组数据:现在是一个数据指数增长的时代,根据IDC数据预测,2025年全世界将产生175ZB的数据。未来5年的产生数据,将是过去所有产生数据的2倍以上。

图片

这里面大部分数据是不需要存储的,在2025预计每年需要存储11ZB的数据。换算个容易理解的说法,1ZB是10^18Bytes, 相当于要写5556万块容量18TB的硬盘。

图片

这些存储的数据中,仅10%认为是Hot频繁访问的数据,90%的数据都将是Warm/Cold温冷数据, 也就是不经常访问的数据。举个简单的例子,我们目前每人至少1部智能手机,里面存储大量的照片、视频、聊天记录等个人隐私数据,这些数据自产生后,我们开始可能会经常访问,在3个月以后,你还会对着数据有访问的诉求吗?这个概率基本会下降到1%以下

图片

从概率统计学来讲,超过3个月(90天)不再访问的数据,我们都可以称为冷数据,归档数据。每年全世界有25-35%的新增归档冷数据需要存储。这个市场的需求是非常的庞大。

图片

目前归档冷数据的最终归属大多数是基于HDD,SMR,磁带Tape等介质的冷存储系统。冷存储系统的最大的优点就是成本低和数据保留时间长,但是也带来相应的缺点就是冷归档数据读取过程需要“解冻”,数据访问响应时间拉长。

图片

从上图存储介质的出货量和类型数据,我们也可以看到,在2025年,机械硬盘包括SMR新型机械盘存储介质的占比仍然有50%。这么多的数据需要存储,这部分对硬盘的容量要求越来越高。对于大容量盘,除了上一篇文章(HDD最后的冲刺:大容量硬盘的奋力一搏)中提到的,硬盘厂商希捷/西数WDC/东芝在发力搞HAMR/MAMR。

3.磁带与HDD的融合

这几天,小编又无意间发现,西数WDC还在研究磁带,甚至已经取得了多项专利,涵盖硬盘和磁带驱动器的设计和机制的组合。

专利1(20200258544):嵌入式磁带驱动器

图片

图片

专利2(11081132): 带有HDD组件的嵌入式磁带驱动器

图片

图片

专利3(11393498):嵌入式磁带驱动器的磁头组装

图片

图片

WDC 希望摆脱磁带驱动器和磁带库,并将任何磁带变成磁盘外形规格的驱动器。这暗示了一种有趣的可能性,即将磁带驱动器的基本组件与实际的磁带介质合并,以降低磁带库固有的环境和技术复杂性,并将访问时间至少缩短一个数量级

磁带/磁带库的运行还是比较复杂的,更多细节可以参考之前发布的关于磁带的相关文章:

针对嵌入式磁带,Western Digital 的专利建议采用标准化的外形尺寸,即 2.5 英寸或 3.5 英寸,以便数据中心和超大规模提供商更容易采用。嵌入式磁带驱动器的价格,肯定比普通的磁带要贵,但也低于企业级的硬盘。

图片

也许最大的挑战是将这种新颖的磁带方法引入 LTO 联盟,该组织负责监督 LTO 的开发,由 IBM、HPE 和 Quantum 组成,所有这些公司可能都有不同的商业策略,需要昂贵的驱动器和廉价的磁带。

磁带的格式和技术标准,在之前有很多种类,也导致各种不兼容。为了解决这个问题,上世纪90年代,三个厂商联合研发线性磁带开放 技术,LTO,Linear Tape Open。LTO标准最初有两个格式,一个Ultrium,主要负责支持大容量技术,一个Accelis,主要负责高性能。磁带被采用的原因,目前跟性能也不相关,要性能的话,早就切换固态硬盘SSD了。所以目前一说LTO,基本上大家就等同于LTO Ultrium。

图片

据了解,WDC希望可以通过这个技术,把盘的容量提升到100TB+。这个想法非常大胆!现在最新的磁带LTO9,压缩容量也只是45TB。小编认为实现100TB还是有很大难度的。

图片

梦想还是要有的,万一实现了呢?祝福WDC好运,可以早日把专利变成商品!

<think>好的,用户现在了解顺序存取的定义和应用场景。首先,我需要明确顺序存取的基本概念,确保定义准确无误。顺序存取指的是按照数据存储的物理顺序依次访问,不能跳过前面的数据直接访问后面的内容。这和随机存取不同,比如磁带就是典型的顺序存取设备,而内存或SSD属于随机存取。 接下来要思考应用场景。用户可能知道顺序存取在实际中有哪些用途。常见的例子包括磁带备份,虽然现在用的不多,但在大容量数据归档中仍有应用。然后是日志文件处理,系统日志通常按时间顺序写入,顺序读取效率高。流媒体传输也是,比如视频播放需要连续的数据流,顺序存取能减少延迟。还有大数据处理中的顺序读取,比如Hadoop处理大量数据时顺序访问更高效。 用户可能还关心顺序存取的优缺点。需要提到访问速度在连续读取时快,但随机访问慢;存储成本低,适合大规模数据;数据恢复方便,但修改效率低。这些点能帮助用户全面理解其适用场景。 需要检查是否有混淆顺序存取和顺序访问的可能,确保术语使用正确。同时,考虑用户是否有更深层的需求,比如比较不同存储方式,或者技术选型时的考量因素。是否需要举例说明不同存储介质,比如磁盘和磁带的区别? 最后,生成相关问题时要围绕顺序存取的特点、与其他存取方式的对比、具体技术实现等,帮助用户进一步探索。例如,顺序存取和随机存取的区别,优化方法,数据库中的应用等。确保问题有针对性,能够引导用户深入学习。</think>### 顺序存取的定义 **顺序存取**(Sequential Access)是一种数据访问方式,要求按照数据存储的物理顺序依次访问,无法跳过前面的数据直接定位到目标位置。其特点是: - 必须从起始位置开始逐个遍历,例如磁带读取[^1] - 访问时间与数据位置线性相关,$t = k \cdot n$($n$为数据序号,$k$为系数) - 适合连续数据块处理 ### 顺序存取的应用场景 1. **磁带存储系统** 磁带通过物理卷动磁带来定位数据,典型场景: - 企业级数据备份与归档(如银行交易记录) - 冷数据存储(访问频率低于1次/年) 2. **日志文件处理** 系统日志按时间顺序写入文件,顺序读取效率高于随机访问: ```text 2023-10-01 08:00:00 [INFO] System started 2023-10-01 08:00:05 [WARN] Memory usage 85% ``` 分析日志时通常按时间范围顺序扫描 3. **流媒体传输** 视频点播服务使用顺序存取模式: $$ \text{视频流} = \{I帧, P帧, B帧, P帧, ...\} $$ 必须按编码顺序解码播放 4. **大数据批处理** Hadoop处理TB级数据时,HDFS默认采用顺序读写策略,吞吐量可达$$ 200\,MB/s \times N_{\text{节点}} $$ ### 技术特性对比 | 特性 | 顺序存取 | 随机存取 | |--------------|----------------|----------------| | 访问时间复杂度 | $O(n)$ | $O(1)$ | | 典型存储介质 | 磁带、机械硬盘 | SSD、内存 | | 适用场景 | 批量数据处理 | 数据库索引查询 |
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

古猫先生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值