Hadoop完全分子式环境搭建—问题及解决办法

Hadoop完全分布式环境搭建

ps:本人是按照尚硅谷的教程搭建的,版本hadoop2.7,centos版本6,一台主机,两台从机。

一.版本问题
1.尽量使用hadoop版本2,尽量不要使用最新版本3。因为会出现无法解决的问题,老师和网上给的配置方案基本都是基于hadoop2.6或hadoop2.7,所有用hadoop3在群起集群时会出现问题。

二.虚拟机准备工作
1.关闭虚拟机防火墙,以免出现因防火墙出现的问题(比如后面时间同步时):
查看防火墙状态:service iptables status
永久关闭防火墙:chkconfig iptables off (重启后生效)
2.设置静态IP
需查看自己VM的虚拟网络net8的IP地址以及网关。(重启后生效)
在这里插入图片描述
在这里插入图片描述

3.修改主机名,添加主机名与IP的映射。映射后可以直接ping主机名。(重启后生效)
查看hosts(W / L)
C:\Windows\system32\drivers\etc hosts
如果没做,cmd不能直接ping 主机名;Web访问不能直接用主机名。
在这里插入图片描述

4.安装配置jdk、hadoop;
(1).可以把虚拟机默认的jdk卸载。

在这里插入图片描述

(2). 解压完后,修改jdk,hadoop文件名,方便环境变量配置(多出使用)。
mv 原文件名 新文件名

5.安装Xshell,无法上传文件到Linux:
(输入rz命令无响应)
安装lrzsz方便两个不同系统上传(rz)、下载(sz)文件:
yum provides */rz
yum install -y lrzsz

6.克隆3台机器:(克隆后不能马上使用这三台机器)
修改内容:
(1)vim /etc/udev/rules.d/70-persistent-net.rules
dd删除
在这里插入图片描述

shift+$,改eth1为eth0
在这里插入图片描述

复制地址
在这里插入图片描述

注意:service network restart

(2)vim /etc/sysconfig/network-scripts/ifcfg-eth0
粘贴HWADDR
修改IPADDR为本机地址
在这里插入图片描述

(3)vim /etc/sysconfig/network
修改主机名
在这里插入图片描述

查看hosts(W / L)

注意:重启生效(reboot)

二.集群配置
1.忘记拷贝配置文件
方法一:scp(secure copy)安全拷贝:scp可以实现服务器与服务器之间的数据拷贝
拷贝hadoop安装文件到集群slave节点
scp -r /usr/local/hadoop-2.6.5 slave1:/usr/local
scp -r /usr/local/hadoop-2.6.5 slave2:/usr/local
scp -r /usr/local/hadoop-2.6.5 slave3:/usr/local

方法二. 在主机上编写xsync集群分发脚本:
(1)解决集群文件配置的一致性。
需求:循环复制文件到所有节点的相同目录下,可以同步所有结点的文件。
方便修改,不用挨个去改(比如将NameNode等分开放)。
(2)创建脚本:
在/home目录下创建bin目录,并在bin目录下xsync创建文件
在这里插入图片描述
在这里插入图片描述

(3)修改权限:
chmod 777 xsync

2.多次格式化NameNode导致NameNode和DataNode进程不能同时工作:
格式化NameNode,会产生新的集群id,导致 DateNode的集群id不一致,集群找不到以往数据。所以,第二次格式NameNode时,一定要先删除data数据和log日志,然后再格式化NameNode。

3.SSH没有配置好。
所有机器都要拷贝,拷贝后生成Authorized_keys(授权keys)文件,因为只要需要判断要不要密码,都会去找Authorized_keys文件。
在这里插入图片描述

4.配置文件修改不仔细。

四.启动集群
1.jps不生效。
原因:全局变量hadoop、java没有生效。解决办法:需要source /etc/profile文件。
2.(个别机器)start(stop)-all.sh 无法启动Recesourmanager
修改:start(stop)-yarn.sh
将daemon加s

五.Web端口
1.hadoop版本3端口为:9870
2.hadoop版本2端口为:50070

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在搭建Hadoop服务器集群过程,可能会遇到一些常见问题。以下是一些可能出现的问题及相应的解决办法: 1. 网络连接问题:确保集群的服务器能够相互通信,检查网络配置、防火墙设置等。可以通过ping命令检查服务器之间的连通性。 2. SSH连接问题:如果无法通过SSH进行免密登录,可以检查SSH配置、密钥文件等。确保每台服务器的SSH服务正常运行,并且公钥已正确配置。 3. Java环境问题:如果Hadoop无法找到Java环境,可以检查Java的安装路径和环境变量设置。确保每台服务器上都正确安装了适合的Java Development Kit (JDK)。 4. Hadoop配置问题:在编辑Hadoop的配置文件时,可能会出现错误的配置或格式不正确导致集群无法正常启动。建议仔细检查配置文件的语法和参数设置,可以参考官方文档或其他资源进行正确配置。 5. HDFS格式化问题:在格式化HDFS时,可能会遇到权限或文件系统错误导致格式化失败。确保有足够的权限执行格式化操作,并且没有其他进程占用HDFS的相关目录。 6. 资源分配问题:如果集群的节点无法正常分配资源或任务无法运行,可以检查资源管理器(如YARN)的配置和日志,确保资源分配策略和配置正确。 7. 集群安全问题:如果需要启用Hadoop的安全功能(如Kerberos认证),可能会遇到配置和认证问题。在启用安全功能前,建议详细阅读相关文档,并按照指导进行正确配置。 8. 高可用性配置问题:如果需要实现Hadoop集群的高可用性,配置过程可能会较为复杂。建议仔细阅读相关文档,并按照指导进行正确配置,包括故障转移、备份节点等。 9. 日志和错误排查:在搭建过程,如果遇到问题,可以查看Hadoop的日志文件和错误信息,以便更好地定位问题。可以通过日志来分析异常、错误和警告信息,并尝试解决或定位问题。 以上是一些常见的问题解决办法,具体的问题和解决方案可能会因环境和配置的不同而有所差异。在遇到问题时,可以参考官方文档、社区论坛或其他相关资源,进行更详细的排查和解决。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值