Hadoop集群切换伪分布式时Master上jps没有Datanode解决方法

问题:Hadoop的五个分布式环境文件都修改好了,但在Master节点上jps的时候不出现datanode,格式化namenode :hadoop namenode -format 也没有效果。

分析:在之前配置分布式环境文件的时候产生过一个hadoop/tmp 日志文件,需要删除

解决方法:关掉Hadoop进程:stop-dfs.sh 或关闭所有进程 stop-all.sh ,进入hadoop安装路径把整个tmp文件夹删掉:rm -rf /usr/local/hadoop/tmp,新建一个tmp文件夹mkdir tmp。然后格式化hadoop namenode -format,一般就解决了,但为了保险起见可以再格式化datanode,同理用hadoop datanode -format

一定要先关闭Hadoop进程!!!

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
⼤数据平台常见⾯试题 第1部分 申请ID.. 3 第2部分 部署kafka. 4 2.1 部署86节点kafka. 4 2.2 配置86节点zookeeper. 5 2.3 部署87节点kafka. 5 2.4 配置87节点zookeeper. 5 第3部分 启动zookeeper. 5 3.1 启动86节点启动zookeeper-1服务... 5 3.2 启动87节点启动zookeeper-2、zookeeper-3服务... 6 第4部分 启动kafka. 6 4.1 启动86节点kafka服务... 6 4.2 启动87节点kafka服务... 6 第5部分 创建topic. 7 5.1 测试Topic(可选)... 7 5.2 创建⽣产的topic. 7 第1部分 选择题 1.1 Hadoop选择题 1.1.1 Hdfs 1. 下⾯哪个程序负责 HDFS 数据存储? a)NameNode b)Jobtracker c)Datanode d)secondaryNameNode e)tasktracker 2. HDfS 的 block 默认保存⼏份? a)3份 b)2份 c)1份 d)不确定 3. 下列哪个程序通常与NameNode 在⼀个节点启动? a)SecondaryNameNode b)DataNode c)TaskTracker d)Jobtracker 注:haoop1.X 分析: hadoop集群是基于 master/slave 模式,namenode 和 jobtracker 属于 masterdatanode 和 tasktracker属于 slave,master 只 有⼀个,⽽ slave 有多个。SecondaryNameNode 内存需求和 NameNode 在⼀个数量级上,所以通常 secondary NameNode(运⾏在 单独的物理机器上)和 NameNode 运⾏在不同的机器上。 JobTracker 和 TaskTracker JobTracker 对应于 NameNode TaskTracker 对应于 DataNode DataNode 和 NameNode 是针对数据存放来⽽⾔的 JobTracker 和 TaskTracker 是对于 MapReduce 执⾏⽽⾔的 mapreduce ⼏个主要概念,mapreduce 整体上可以分为这么⼏条执⾏线索: jobclient,JobTracker 与 TaskTracker。 1、JobClient 会在⽤户端通过 JobClient 类将应⽤已经配置参数打包成 jar ⽂件存储到 hdfs,并把路径提交到 Jobtracker,然后由 JobTracker 创建每⼀个 Task(即 MapTask 和 ReduceTask)并将它们分发到各个 TaskTracker 服务去执⾏ 2、JobTracker 是⼀个 master 服务,软件启动之后 JobTracker 接收 Job,负责调度 Job 的每⼀个⼦任务 task运⾏于 TaskTracker 上,并监控它们,如果发现有失败的 task 就重新运⾏它。⼀般情况应该把 JobTracker 部署在单独的机器上。 3、TaskTracker 是运⾏在多个节点上的 slaver 服务。TaskTracker 主动与 JobTracker 通信,接收作业,并负责直接执⾏每⼀个任务。 TaskTracker 都需要运⾏在 HDFS 的 DataNode 上 4. HDFS 默认 Block Size a)32MB b)64MB c)128MB 注:旧版本是64MB 5. Client 端上传⽂件的候下列哪项正确 a)数据经过 NameNode 传递给 DataNode b)Client 端将⽂件切分为 Block,依次上传 c)Client 只上传数据到⼀台 DataNode,然后由 NameNode 负责 Block 复制⼯作 分析: Client 向 NameNode 发起⽂件写⼊的请求。 NameNode 根据⽂件⼤⼩和⽂件块配置情况,返回给 Client 它所管理部分 DataNode 的信息。 Client 将⽂件划分为多个 Block,根据 DataNode 的地址信息,按顺序写⼊到每⼀个 DataNode。 6. 下⾯与 HDFS 类似的框架是?C A NTFS B FAT32 C GFS D EXT3 7. 的 8. 的 1.1.2 集群管理 1. 下列哪项通常是集群的最主要瓶颈 a)CPU b)⽹络 c)磁盘 IO d)内存 解析: 由于⼤数据⾯临海量数据,读写数据都需要 io,然后还要冗余数据,hadoop ⼀般备 3 份数据,所以 IO
在进行Hadoop开发前,需要先配置好Hadoop的开发环境,包括安装Hadoop和搭建分布式集群。以下是Hadoop安装分布式集群搭建的步骤: 1. 下载HadoopHadoop官网下载最新版本的Hadoop压缩包。当前最新版本是3.3.1。 2. 解压缩Hadoop 将下载的Hadoop压缩包解压缩到本地目录,比如/opt/hadoop。解压缩后,会得到一个hadoop-3.3.1目录。 3. 配置Hadoop环境变量 在~/.bashrc文件添加以下内容: export HADOOP_HOME=/opt/hadoop/hadoop-3.3.1 export PATH=$PATH:$HADOOP_HOME/bin 然后执行source ~/.bashrc,使配置生效。 4. 配置Hadoop 进入Hadoop安装目录,修改配置文件。以下是必须修改的配置文件: - core-site.xml 在Hadoop安装目录的/etc/hadoop/目录下,创建core-site.xml文件,并添加以下内容: <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration> 这个配置指定了Hadoop的默认文件系统为HDFS,并且HDFS的访问地址为localhost:9000。 - hdfs-site.xml 在Hadoop安装目录的/etc/hadoop/目录下,创建hdfs-site.xml文件,并添加以下内容: <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration> 这个配置指定了HDFS的副本数为1。 - mapred-site.xml 在Hadoop安装目录的/etc/hadoop/目录下,创建mapred-site.xml文件,并添加以下内容: <configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration> 这个配置指定了MapReduce的框架为YARN。 - yarn-site.xml 在Hadoop安装目录的/etc/hadoop/目录下,创建yarn-site.xml文件,并添加以下内容: <configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name> <value>org.apache.hadoop.mapred.ShuffleHandler</value> </property> </configuration> 这个配置指定了NodeManager的辅助服务为mapreduce_shuffle,并且指定了ShuffleHandler类。 5. 格式化HDFS 在Hadoop安装目录下,执行以下命令: $ hdfs namenode -format 这个命令会格式化HDFS,清空HDFS的所有文件。 6. 启动HadoopHadoop安装目录下,执行以下命令: $ start-all.sh 这个命令会启动Hadoop的所有组件,包括NameNodeDataNode、ResourceManager、NodeManager等。 7. 验证Hadoop是否正常工作 在浏览器访问http://localhost:8088/,可以看到YARN的Web界面。在浏览器访问http://localhost:50070/,可以看到HDFS的Web界面。 至此,Hadoop安装分布式集群搭建完成。可以开始进行Hadoop的开发了。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值