1、概要
1. 基于jdk1.8(最低版本要求) |
2. mr采用基于内存的计算,提升性能(快spark 10倍) |
3. hdfs 通过最近black块计算,加快数据获取速度(块大小:256M) |
4. 支持多NameNode(实现了更加可靠的HA) |
5. 引入EC纠删码技术(EC: Erasure Coding) 存储空间节省50% |
6. 精简了内核 |
7.hadoop shell脚本重构 |
8.默认端口修改 |
9.支持数据的balancer(平衡)Intra-datanode均衡器 |
10. 基于API来配置 Capacity Scheduler 队列的配置 |
领取相关资料可以加小编微信获取哦:mipi946
2、主要变动介绍总架构的改变>> 1. Shell脚本重写(1)增加了参数冲突检测,避免重复定义和冗余参数
(2)CLASSPATH, JAVA_LIBRARY_PATH, and LD_LIBRARY_PATH等参数的去重,缩短环境变量
(3)shell脚本重构,将更多的代码加入function中,提供重载,删除重复代码,便于测试
(4)脚本清理和简化
(5)尽可能与当前系统保持兼容
(6)提供一份Hadoop环境变量列表
(7) 提供一份Hadoop环境变量列表 Shell脚本现在支持一个–debug选项,它将报告有关各种环境变量,java选项,classpath等构造的基本信息,以帮助进行配置调试。
(8) 增加了distch和jnipath子命令到hadoop命令。
(9) 触发ssh连接的操作现在可以使用pdsh(如果已安装)。$ {HADOOP \ _SSH \ _OPTS}仍然被应用。