错误原因
由于在启动大数据集群时,电脑突然卡机(完全卡死),然后强制关机,再次启动集群时发现namenode启动不起来
查看log日志发现以下错误:
出现错误:ERROR org.apache.hadoop.hdfs.server.namenode.FSImage: Failed to load image from FSImageFile(file=/opt/module/hadoop-3.1.3/data/dfs/name/current/fsimage_0000000000000023765, cpktTxId=0000000000000023765)
说这个文件加载失败,fsimage_0000000000000023765
解决办法
网上有两种解决办法:
第一种:将其他正常启动节点namenode的opt/module/hadoop-3.1.3/data/dfs/name/current/下的文件copy过来,但是我就一个namenode节点,显然这个解决不了问题
第二种:将hadoop集群重新格式化,重新格式化数据丢失不说,还会出现各种错误,显然也是下下策
我的解决办法
将上面报错的文件先进行备份,然后将其删除,重新启动集群即可解决问题(亲测有效)
友情提示:如果不放心建议将集群进行快照,以免后续出现问题