Hadoop版本升级（2.7.6 => 3.1.2）

最新推荐文章于 2023-11-25 17:09:15 发布

aju1790

最新推荐文章于 2023-11-25 17:09:15 发布

阅读量2k

点赞数 2

文章标签：大数据开发工具

原文链接：http://www.cnblogs.com/luengmingbiao/p/11324801.html

版权

　　自己的主机上的Hadoop版本是2.7.6，是测试用的伪分布式Hadoop，在前段时间部署了Hive on Spark，但由于没有做好功课，导致了Hive无法正常启动，原因在于Hive 3.x版本不适配Hadoop 2.x版本。之前我在学校服务器上部署的Hadoop版本是3.1.2，现打算将自己的从2.7.6升级到3.1.2版本，同时也当作练练手并记录以便以后参考。这是一个大版本跨度的升级操作，所以先参考Hadoop权威指南上的方案以及官方文档，然后拟定了升级和回滚方案。

　　根据官方文档所说：

”For non-HA clusters, it is impossible to upgrade HDFS without downtime since it requires restarting the namenodes. However, datanodes can still be upgraded in a rolling manner.“

也就是说对于非HA群集，由于需要重新启动名称节点，因此无法在没有停机的情况下升级HDFS。但是，仍可以回滚方式升级datanode。

　　注意：仅从Hadoop-2.4.0开始支持滚动升级。

　　Hadoop升级最主要是HDFS的升级，HDFS的升级是否成功，才是升级的关键，如果升级出现数据丢失，则其他升级就变得毫无意义。

　　解决方法：

备份HDFS的NameNode元数据，升级后，对比升级前后的文件信息。
单台升级DataNode，观察升级前后的Block数（有较小浮动范围，v2与v3的计数方式不一样）。

第一阶段停机以及备份NameNode目录

通过命令stop-yarn.sh和stop-dfs.sh关闭HDFS集群：

# stop-yarn.sh
# stop-dfs.sh

　　然后备份NameNode目录到NFS或者其他文件系统中，如果不记得NameNode目录存储的地址可以通过查看hdfs-site.xml文件的ÿ

最低0.47元/天解锁文章

关注

2
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
Hadoop版本升级（2.7.6 => 3.1.2）

　　自己的主机上的Hadoop版本是2.7.6，是测试用的伪分布式Hadoop，在前段时间部署了Hive on Spark，但由于没有做好功课，导致了Hive无法正常启动，原因在于Hive 3.x版本不适配Hadoop 2.x版本。之前我在学校服务器上部署的Hadoop版本是3.1.2，现打算将自己的从2.7.6升级到3.1.2版本，同时也当作练练手并记录以便以后参考。这是一个大版本跨度...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。