CM集群管理注意事项

最新推荐文章于 2024-06-29 19:55:33 发布

人蠢多读书

最新推荐文章于 2024-06-29 19:55:33 发布

阅读量1.5k

点赞数

分类专栏：大数据运维之cloudera manager日常文章标签： CM管理集群

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35440040/article/details/79971638

版权

大数据运维之cloudera manager日常专栏收录该内容

14 篇文章 0 订阅

订阅专栏

一.节点下线：

出先问题：大批量丢死块（2000多个）

原因：下线节点的时候一块下了10个节点。

解决办法：3个副本下线机器的时候最好2台2台的下，还要看nn（50070主页面）页面上的进度，到0了以后在删除节点。

文本解释：

Decommission Datanode就是把Datanode从HDFS集群中移除掉。

Datanode是存储实际数据的，因此在Decommission Datanode的时候需要把Datanode上的数据迁移到别的机器上。下线的时候Datanode会有以下操作，1：计算块信息 2：删除块 3：copy块 4：校验块信息

操作步骤
1：在Namenode上，把需要Decommission的Datanode的机器名加入到dfs.hosts.exclude(该配置项在hdfs-site.xml)所指定文件中，也就是告诉Namenode哪些Datanode要被Decommission。
如果hdfs-site.xml没有找到dfs.hosts.exclude，那么就手动把下面内容加入到hdfs-site.xml中，然后把需要Decommission的机器写到文件/etc/hadoop/conf/dfs.exclude中去。

<property> <name>dfs.hosts.exclude</name> <value>/etc/hadoop/conf/dfs.exclude</value> </property>

exclude 例子： pslave1 pslave2 pslave3

2 . 用如下命令启动Decommission：

hdfs dfsadmin -refreshNodes

刷新后在hfs页面可以看见 Decommission In Progress 的节点

hadoop dfsadmin -report：也可以查看

note：如果加速下线可以把块的复制个数减少

人蠢多读书

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。