现象
集群配置了NameNode HA,突然发生一台NameNode节点所在的数据盘如/data1磁盘故障需要更换磁盘,原来的磁盘下面的目录将都不可用。
/data1目录下面的主要目录为dfs目录,

更换磁盘并启动hadoop相关服务后,我们发现dfs目录自动创建dfs/dn、dfs/jn及dfs/nn都已经创建,但HDFS仍然不正常,具体为更换磁盘节点的NameNode服务及JournalNode服务异常,如下图所示

解决方案
出现此问题,是因为更换了磁盘后dfs/jn目录下没有VERSION文件用来恢复,查看dfs/jn/目录下确实为空。解决方法是重新创建对应目录结构,并拷贝其他JouralNode上的VERSION文件,之后重启JournalNode服务,会自动进行目录的初始化并自动同步日志。
cd /data1/dfs/jn
mkdir -p nameservice1/current
scp 10.19.41.60:/data1/dfs/jn/nameservice1/current/VERSION :/data1/dfs/jn/nameservice1/current/
chown -R hdfs.hdfs /data1/dfs/jn
 
                   
                   
                   
                   
                            
 
                             
                             当NameNode HA集群中的一台NameNode节点数据盘故障,更换磁盘后,发现HDFS服务未恢复正常,特别是NameNode和JournalNode服务出现异常。问题在于更换磁盘后,/data1/dfs/jn目录下的VERSION文件缺失,导致JournalNode无法启动。解决方法是手动创建相应目录结构,从正常运行的JournalNode上复制VERSION文件到新磁盘,并确保权限正确,然后重启JournalNode服务,使得服务能够自动初始化并同步日志。
当NameNode HA集群中的一台NameNode节点数据盘故障,更换磁盘后,发现HDFS服务未恢复正常,特别是NameNode和JournalNode服务出现异常。问题在于更换磁盘后,/data1/dfs/jn目录下的VERSION文件缺失,导致JournalNode无法启动。解决方法是手动创建相应目录结构,从正常运行的JournalNode上复制VERSION文件到新磁盘,并确保权限正确,然后重启JournalNode服务,使得服务能够自动初始化并同步日志。
           
       
           
                 
                 
                 
                 
                 
                
               
                 
                 
                 
                 
                
               
                 
                 扫一扫
扫一扫
                     
                     
              
             
                   1163
					1163
					
 被折叠的  条评论
		 为什么被折叠?
被折叠的  条评论
		 为什么被折叠?
		 
		  到【灌水乐园】发言
到【灌水乐园】发言                                
		 
		 
    
   
    
   
             
					 
					 
					


 
            