Hadoop：格式化脚本【删除所有节点的所有数据，重新格式化HDFS】【使用Hadoop之前需要格式化】

u013250861

于 2023-04-01 12:22:05 发布

阅读量906

点赞数 1

分类专栏： # 大数据/Hadoop 文章标签： hadoop hdfs 大数据

本文链接：https://blog.csdn.net/u013250861/article/details/129895402

版权

大数据/Hadoop 专栏收录该内容

21 篇文章 2 订阅

订阅专栏

如果集群是第一次启动，需要在配置为NameNode的节点（比如：hadoop102节点）格式化NameNode（注意：格式化NameNode，会产生新的集群id，导致NameNode和DataNode的集群id不一致，集群找不到已往数据。如果集群在运行过程中报错，需要重新格式化NameNode的话，一定要先停止namenode和datanode进程，并且要删除所有机器的data和logs目录，然后再进行格式化。）

#!/bin/bash
# 用于删除所有节点的data目录、logs目录，用于重新格式化
# 格式化：hdfs namenode -format
myhadoop.sh stop
for host in hadoop102 hadoop103 hadoop104
do
        ssh $host rm -rf /opt/module/hadoop-3.1.3/data
        ssh $host rm -rf /opt/module/hadoop-3.1.3/logs
        ssh $host sudo rm -rf /tmp/*
        echo ================$host已删除======================
done
# 重新格式化
hdfs namenode -format

u013250861

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Hadoop：格式化脚本【删除所有节点的所有数据，重新格式化HDFS】【使用Hadoop之前需要格式化】

NameNode的节点（比如：hadoop102节点）格式化NameNode。不一致，集群找不到已往数据。如果集群在运行过程中报错，需要重新格式化。进程，并且要删除所有机器的。目录，然后再进行格式化。如果集群是第一次启动。
复制链接

扫一扫

专栏目录