HDFS 3.x 数据存储新特性-纠删码

HDFS是⼀个⾼吞吐、⾼容错的分布式⽂件系统,但是HDFS在保证⾼容错的同时也带来⾼昂的存储成本,⽐如有5T的数据存储在HDFS上,按照HDFS的默认3副本机制,将会占⽤15T的存储空间。那么有没有⼀种能达到和副本机制相同的容错能⼒但是能⼤幅度降低存储成本的机制呢,有,就是在HDFS 3.x 版本引⼊的纠删码机制。

EC(纠删码)

EC(纠删码)是⼀种编码技术,在 HDFS 之前,这种编码技术在廉价磁盘冗余阵列(RAID)中应⽤最⼴泛,RAID 通过条带化技术实现 EC, 条带化技术就是⼀种⾃动将 I/O 的负载均衡到多个物理磁盘上的技术 ,原理就是将⼀块连续的数据分成很多⼩部分并把他们分别存储到不同磁盘上去,这就能使多个进程同时访问数据的多个不同部分⽽不会造成磁盘冲突(当多个进程同时访问⼀个磁盘时,可能会出现磁盘冲突),⽽且在需要对这种数据进⾏顺序访问的时候可以获得最⼤程度上的 I/O 并⾏能⼒,从⽽获得⾮常好的性能。
在HDFS中,把连续的数据分成很多的⼩部分称为
  • 24
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
hadoop-env.sh是Hadoop的环境变量配置文件,用于设置Hadoop运行环境的各种参数。其中主要包含以下参数: 1. HADOOP_HEAPSIZE:设定Hadoop所使用的Java虚拟机的堆内存大小。 2. HADOOP_OPTS:用于设置Hadoop运行时的Java虚拟机参数。 3. HADOOP_NAMENODE_OPTS:用于设置NameNode节点的Java虚拟机参数。 4. HADOOP_DATANODE_OPTS:用于设置DataNode节点的Java虚拟机参数。 5. HADOOP_SECONDARYNAMENODE_OPTS:用于设置SecondaryNameNode节点的Java虚拟机参数。 6. HADOOP_JOB_HISTORYSERVER_OPTS:用于设置JobHistoryServer节点的Java虚拟机参数。 core-site.xml是Hadoop的核心配置文件,用于配置Hadoop的核心参数。其中主要包含以下参数: 1. fs.defaultFS:指定Hadoop的文件系统的默认URL。 2. hadoop.tmp.dir:指定Hadoop的临时文件存储目录。 3. io.file.buffer.size:指定Hadoop读写文件时的缓冲区大小。 4. hadoop.proxyuser.*.hosts和hadoop.proxyuser.*.groups:用于配置代理用户的主机和组。 hdfs-site.xml是Hadoop分布式文件系统(HDFS)的配置文件,用于配置HDFS的参数。其中主要包含以下参数: 1. dfs.replication:指定HDFS数据的副本数。 2. dfs.namenode.name.dir和dfs.datanode.data.dir:分别指定NameNode和DataNode存储数据的目录。 3. dfs.permissions.enabled:指定是否启用HDFS的权限控制。 4. dfs.blocksize:指定HDFS数据块的大小。 yarn-site.xml是Hadoop的资源管理器(YARN)的配置文件,用于配置YARN的参数。其中主要包含以下参数: 1. yarn.nodemanager.aux-services和yarn.nodemanager.aux-services.mapreduce.shuffle.class:用于配置NodeManager上的附属服务,如MapReduce的shuffle服务。 2. yarn.resourcemanager.hostname:指定ResourceManager的主机名。 3. yarn.scheduler.minimum-allocation-mb和yarn.scheduler.maximum-allocation-mb:分别指定YARN的最小和最大资源分配单元的内存大小。 4. yarn.nodemanager.resource.memory-mb:指定NodeManager的可用内存大小。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

数据与算法架构提升之路

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值