hadoop集群故障排除(定期更新)

最新推荐文章于 2024-06-28 15:37:22 发布

宝罗Paul

最新推荐文章于 2024-06-28 15:37:22 发布

阅读量2.8k

点赞数 2

分类专栏：大数据文章标签： hadoop 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_31598113/article/details/61625968

版权

本文详述了两个常见的Hadoop集群故障及其解决方法。故障一涉及DataNode进程启动失败，原因是datanode和namenode的clusterID不一致，解决办法是同步它们的clusterID。故障二是在集群上运行MapReduce作业失败，原因是节点时间不一致，通过同步系统时间解决了问题。

摘要由CSDN通过智能技术生成

故障一：某个datanode节点无法启动

我是以用户名centos安装和搭建了一个测试用的hadoop集群环境，也配置好了有关的权限，所有者、所属组都配成centos:centos

【故障现象】

名称节点的3个进程都起来了，但是其中一个数据节点的DataNode进程没启动，就是说在该数据节点上通过jps没查到有关进程。

【排查过程】

登录此故障节点（主机名为s203）的日志存放目录$ cd $HADOOP_HOME/logs/

查看日志hadoop-centos-datanode-s203.log，发现有一行FATAL级别的错误：

FATAL org.apache.hadoop.hdfs.server.datanode.DataNode: Initialization failed for Block pool <registering> (Datanode Uuid unassigned)

还有一行：

java.io.IOException: Incompatible clusterIDs in /tmp/hadoop-centos/dfs/data: namenode clusterID = CID-8ba03cf7-a71d-4439-8818-c0a65f47e7aa; datanode clusterID = CID-7d9b5e26-d96e-4596-b42e-5810aaacedf8

从字面上来看，报错信息大意是datanode所属的集群ID和namenodeID不一致,。这就导致了该data node无法加入到同一个集群里面去(每个hadoop集群的ID不能有两个)，所以此数据节点启动失败。

【解决办法】

有两个，一个是删除集群所有主机信息后，格式化名称节点后再启动集群。这个办法会丢失我之前已有的数据，这不是我想要的。

所以我这里采用第二种办法：把无法启动的数据节点所属的

最低0.47元/天解锁文章

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

宝罗Paul CSDN认证博客专家 CSDN认证企业博客

码龄9年

94: 原创

17万+: 周排名

102万+: 总排名

57万+: 访问

: 等级

5000: 积分

95: 粉丝

217: 获赞

83: 评论

509: 收藏

私信

关注

热门文章

分类专栏

JAVA 16篇
大数据 55篇
scala & spark 8篇
python 14篇
shell脚本 7篇

最新评论

Hbase在hdfs上的archive目录占用空间过大
刚果001: list_snapshot显示为空，即没有快照，为什么archive目录也很大？怎么解决呢
shell脚本——如何获取函数的返回值
ArchyZhao: echo命令带换行，接收变量里也有换行
用python标准库difflib比较两份文件的异同
鬼杀: 那个这两个文件，不用传他们的地址吗？
shell脚本——如何获取函数的返回值
ytfrdfiw: 例子1不好的是循环变量cont，但实际又不用。 #!/bin/bash function func1(){ count=0 for i in {1..3}; do count=`expr $i+ 1` #也可用count=$((i+1)这种更为明白 done # 函数中使用return返回时，返回值的数据类型必须是数字 return $count } # 在$()的圆括号中可以执行linux命令,当然也包括执行函数 res1=$(func1) # 变量res2将会接收函数的返回值，这里是3 res2=`echo $?` if [[ $res2 == 4 ]]; then echo "func1() succeeded!" else echo "Not a right number!" fi 上述希望作者采纳，修正一下。
shell脚本——如何获取函数的返回值
容光焕发叔叔: 例子1确定执行过吗？res1=$(func1)执行后，$?的值就不是函数的返回值了吧，而是res1=$(func1)这句指令的返回值了.

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。