今天电脑奔溃后,使得原来一台虚拟机打不开,我删除后重新用集群中一台能用的虚拟机克隆后,链入原来的集群,发现可以使用
但后面发现,这样使得原来被克隆的虚拟机的DataNode不再出现在hadoop集群的资源中。
没找到后续方法,只能将集群中的data和logs文件删除,重新格式化,因为直接格式化会报错
注意:集群中的所有机器都需要删除这两个文件,具体文件位置为:
/opt/app/hadoop-3.1.3/data
和
/opt/app/hadoop-3.1.3/logs
然后重新格式化:
hdfs namenode -format
之后重新启动集群发现可以使用
根据我同学说的,应该是克隆之后集群id会不一样,所有需要修改集群id(我没有使用该操作)
先查看能用的虚拟机的集群id:
/opt/app/hadoop-3.1.3/data/dfs/data/current/BP-1215132245-192.168.1.129-1644146539810/current/VERSION
集群id在该文件内
然后修改不能用的虚拟机的集群id