Hadoop动态扩容,增加节点

最新推荐文章于 2024-06-25 10:40:18 发布

涂作权的博客

最新推荐文章于 2024-06-25 10:40:18 发布

阅读量1.2k

点赞数

分类专栏： # hadoop（HDFS、YARN、MAPREDUCE）

原文链接：https://www.cnblogs.com/mengzj233/p/9759457.html

版权

hadoop（HDFS、YARN、MAPREDUCE）专栏收录该内容

42 篇文章 4 订阅

订阅专栏

转载：https://www.cnblogs.com/mengzj233/p/9759457.html

基础准备

在基础准备部分，主要是设置hadoop运行的系统环境

修改系统hostname（通过hostname和/etc/sysconfig/network进行修改）
修改hosts文件，将集群所有节点hosts配置进去（集群所有节点保持hosts文件统一）
设置NameNode（两台HA均需要）到DataNode的免密码登录（ssh-copy-id命令实现，可以免去cp
*.pub文件后的权限修改）
修改主节点slave文件，添加新增节点的ip信息（集群重启时使用）
将hadoop的配置文件scp到新的节点上

添加DataNode

对于新添加的DataNode节点，需要启动datanode进程，从而将其添加入集群

在新增的节点上，运行hadoop-daemon.sh start datanode即可
然后在namenode通过hdfs dfsadmin -report查看集群情况
最后还需要对hdfs负载设置均衡，因为默认的数据传输带宽比较低，可以设置为64M，即hdfs dfsadmin
-setBalancerBandwidth 67108864即可
默认balancer的threshold为10%，即各个节点与集群总的存储使用率相差不超过10%，我们可将其设置为5%
然后启动Balancer，sbin/start-balancer.sh -threshold 5，等待集群自均衡完成即可

添加Nodemanager

由于Hadoop 2.X引入了YARN框架，所以对于每个计算节点都可以通过NodeManager进行管理，同理启动NodeManager进程后，即可将其加入集群

在新增节点，运行yarn-daemon.sh start nodemanager即可
在ResourceManager，通过yarn node -list查看集群情况

另外更加详细的参考博文：
https://blog.csdn.net/qq_38617531/article/details/82973043

涂作权的博客

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。