Hadoop 3.0x 内容整理

Hadoop 3.0x引入了JDK 8的支持,HDFS Erasure Coding以节省存储空间,支持超过2个NameNodes提高高可用性,并且调整了多项服务的默认端口。Erasure Coding通过校验数据块实现数据恢复,适用于冷数据存储,而NameNode的改进则增强了集群的容错能力。
摘要由CSDN通过智能技术生成

Hadoop 3.0x官方文档

JDK版本升级

Hadoop 3.0x 所有的JAR编译均是在Java 8 环境下编译的。

HDFS Erasure Coding (EC)

Erasure Coding :数据恢复的一种编码容错技术。能节省数据副本存储的磁盘空间。相比2.0x版本能节省一半的磁盘空间,但是会消耗更多其他的资源,比如网络带宽或者CPU

有校验数据块和原始数据块两部分。
校验数据块可以通过原始数据进行编码获得,原始数据块可以通过较验数据块解码获得。

对比HDFS副本机制:hdfs默认3副本机制,解决数据丢失的问题,但是造成存储空间浪费。而ES解决了空间浪费的问题。

ES缺点:数据恢复时,需要同时读取原始数据和校验数据,同时涉及编码解码操作加大CPU开销。所以一般来说它被用于存储冷数据、较少访问的数据

Support for more than 2 NameNodes.

为一个主NameNode和一个备用NameNode提供了HDFS NameNode高可用性的初始实现。通过配置三个JournalNodes,可以实现允许一个NN挂掉的情况。

Hadoop 3.0x 允许用户运行多个备用的名字节点。例如,通过配置三个NameNodes和五个JournalNodes,集群能够容忍两个节点而不是一个节点的失败。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值