解决Hadoop完全分布式集群中从节点jps没有datanode节点问题

当用start-dfs.sh和start-yarn.sh后,在slave节点(从节点)中用jps命令查看进程

正常情况:

有时候可能发现没有Datanode,即只有两项(第一项和最后一项)。原因可能是重复格式化namenode后,导致datanodeclusterIDnamenodeclusterID不一致。

解决方法:

在master节点(namenode):

找到你的hadoop安装目录(我的是/usr/local/hadoop)下的tmp文件:

 进入以下目录(/tmp/dfs/name/current),找到VERSION文件:

 打开,记录namedode下的clusterID:

 然后到你的从节点下(每个从节点都要改),

也是进入这个目录,只不过namenode中的name文件在datanode是变为了data文件,即/tmp/dfs/data/current

然后打开VERSION,把namenode的clusterID替换掉datanode的clusterID就可以了。

  • 14
    点赞
  • 82
    收藏
    觉得还不错? 一键收藏
  • 14
    评论
搭建Hadoop完全分布式集群通常涉及以下几个步骤: 1. **硬件准备**:需要足够的服务器节点,每台机器都应有独立的CPU、内存和磁盘空间,并且网络连接良好。 2. **安装基础软件**:在所有节点上安装Linux操作系统,并配置基本环境,如SSH无密码登录、防火墙设置等。 3. **安装Hadoop**:使用包管理器(如RPM或DEB)或者从源代码构建,按照官方文档在每台机器上安装Hadoop核心组件HDFS (Hadoop Distributed File System) 和 MapReduce框架。 4. **配置**: - 修改`core-site.xml`和`hdfs-site.xml`文件,配置HDFS的名称节点(NameNode)、数据节点DataNodes)地址以及副本数。 - 在`mapred-site.xml`配置MapReduce的相关参数,例如任务调度策略、作业跟踪器的位置等。 - 如果使用Hadoop 2.x及以上版本,还需要配置YARN (Yet Another Resource Negotiator)。 5. **启动服务**:依次启动Hadoop的各种守护进程,包括NameNodeDataNode、JobTracker(或ResourceManager)和TaskTracker(或NodeManager)。 6. **验证集群状态**:通过命令行工具`hadoop fs -ls`检查HDFS是否正常工作,`jps`查看各进程是否运行。 7. **测试应用**:在集群上部署并运行一些MapReduce示例程序,比如WordCount,确认其能成功完成计算。 8. **监控和维护**:配置日志和监控系统,以便及时发现和解决问题,定期备份数据,更新补丁和升级集群
评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值