开发了HDFS那么多年,你知道HDFS支持SSD存储吗?

前言

本文隶属于专栏《1000个问题搞定大数据技术体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!

本专栏目录结构和参考文献请见1000个问题搞定大数据技术体系

正文

随着HDFS的不断完善,它已经从最初只支持单存储介质(磁盘)的单一文件系统逐步演化成支持异构存储介质的综合分布式文件系统,这使得它能够更好地利用新型存储介质, 比如SSD。

HDFS异构存储介质

如图所示,HDFS支持多种常用存储类型,包括:

  1. ARCHIVE:高存储密度但耗电较少的存储介质,通常用来存储冷数据。
  2. DISK:磁盘介质,这是HDFS默认的存储介质。
  3. SSD:固态硬盘,是一种新型存储介质,目前被不少互联网公司使用。
  4. RAM_DISK:数据被写入内存中,同时会往该存储介质中再(异步)写一份。

用户可通过配置参数设置挂载的每块盘的存储类型,比如/grid/dn/disk是磁盘,/grid/dn/ssd 是固态硬盘,可以通过以下方式设置:

<property> 
    <name>dfs.datanode.data.dir</name> 
    <value>[DISK]file:///grid/dn/disk, [SSD]file:///grid/dn/ssd</value> 
</property>

异构存储介质的引入,使得HDFS变成了一个提供混合存储方式的文件系统,用户可以根据数据特点,选择合适的存储介质满足你应用需求。

如下表所示,HDFS提供了多种存储策略,每种策略包含名称、策略含义、创建文件时回退策略以及数据复制时回退策略等属性,当原始放置策略对应的存储空间不够时,HDFS会尝试回退策略中的存储介质。

HDFS允许用户为每个文件单独设置存储策略。

存储策略名称数据块放置策略(n副本)创建文件时回退策略数据复制时回退策略
All SSDSSD: nDISKDISK
One SSDSSD: 1,DISK: n-1SSD,DISKSSD,DISK
Hot(default)DISK: nnoneARCHIVE
WarmDISK: 1, ARCHIVE: n-1ARCHIVE,DISKARCHIVE,DISK
ColdARCHIVE: nnonenone
  • 13
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 13
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值