eclipse远程连接hadoop_Hadoop集群搭建(四)

如果觉得文章好看,欢迎点赞。同时欢迎关注微信公众号:氷泠之路。

4c49c8a60811fee933463e0eee3014f1.gif

@

  • 6.1 `JDK`
  • 6.2 `Hadoop`6.2.1 `hadoop-env.sh`6.2.2 `core-site.xml`6.2.3 `hdfs-site.xml`6.2.4 `workers`6.2.5 复制配置文件
  • 7.1 格式化`HDFS`
  • 7.2 `hadoop-env.sh`
  • 7.3 启动
  • 8.1 环境变量
  • 8.2 `YARN`配置
  • 8.3 开启`YARN`
  • 8.4 测试

1 概述

上一篇文章介绍了如何使用虚拟机搭建集群,到了这篇文章就是实战了,使用真实的三台不同服务器进行Hadoop集群的搭建。具体步骤其实与虚拟机的差不多,但是由于安全组以及端口等等一些列的问题,会与虚拟机有所不同,废话不多说,下面正式开始。

2 约定

  • Master节点的ip用MasterIP表示,主机名用master表示
  • 两个Worker节点的ip用Worker1IP/Worker2IP表示,主机名用worker1/worker2表示
  • 这里为了演示方便统一使用root用户登录,当然生产环境不会这样

3 (可选)本地Host

修改本地Host,方便使用主机名来进行操作:

sudo vim /etc/hosts# 添加MaterIP masterWorker1IP worker1Worker2IP worker2

4 ssh

本机生成密钥对后复制公钥到三台服务器上:

ssh-keygen -t ed25519 -a 100 # 使用更快更安全的ed25519算法而不是传统的RSA-3072/4096ssh-copy-id root@masterssh-copy-id root@worker1ssh-copy-id root@worker2

这时可以直接使用root@host进行连接了:

ssh root@masterssh root@worker1ssh root@worker2

不需要输入密码,如果不能连接或者需要输入密码请检查/etc/ssh/sshd_config或系统日志。

5 主机名

修改Master节点的主机名为master,两个Worker节点的主机名为worker1、worker2:

# Master节点vim /etc/hostnamemaster# Worker1节点# worker1# Worker2节点# worker2

同时修改Host:

# Master节点vim /etc/hostsWorker1IP worker1Worker2IP worker2# Worker1节点vim /etc/hostsMasterIP masterWorker2IP worker2# Worker1节点vim /etc/hostsMasterIP masterWorker1IP worker1

修改完成之后需要互ping测试:

ping masterping worker1ping worker2

ping不通的话应该是安全组的问题,开放ICMP协议即可:

ab63c5d94ec11212eb7fdb1478bb751f.png

在这里插入图片描述

6 配置基本环境

6.1 JDK

scp上传OpenJDK 11,解压并放置于/usr/local/java下,同时修改PATH:

export PATH=$PATH:/usr/local/java/bin

如果原来的服务器装有了其他版本的JDK可以先卸载:

yum remove java

注意设置环境变量后需要测试以下java,因为不同服务器的架构可能不一样:

f2b1913b17662da3c8678374c6ccc755.png

在这里插入图片描述

3d72377b4d2de6a4cc24f2e5b4b5ae5a.png

在这里插入图片描述

比如笔者的Master节点为aarch64架构,而两个Worker都是x86_64架构,因此Master节点执行java时报错如下:

31b9c146b30402a44e3c9912e74f5967.png

在这里插入图片描述

解决办法是通过yum install安装OpenJDK11:

yum install java-11-openjdk

6.2 Hadoop

scp上传Hadoop 3.3.0,解压并放置于/usr/local/hadoop下,注意选择对应的架构:

9ae0eef06b8a372addcc1fd721807054.png

在这里插入图片描述

解压后修改以下四个配置文件:

  • etc/hadoop/hadoop-env.sh
  • etc/hadoop/core-site.xml
  • etc/hadoop/hdfs-site.xml
  • etc/hadoop/workers

6.2.1 hadoop-env.sh

修改JAVA_HOME环境变量即可:

export JAVA_HOME=/usr/local/java # 修改为您的Java目录

6.2.2 core-site.xml

   fs.defaultFS  hdfs://master:9000    hadoop.tmp.dir  /usr/local/hadoop/data/tmp 

具体选项与虚拟机方式的设置相同,这里不再重复叙述。

6.2.3 hdfs-site.xml

   dfs.namenode.name.dir  /usr/local/hadoop/data/namenode    dfs.datanode.data.dir  /usr/local/hadoop/data/datanode    dfs.replication  2 

6.2.4 workers

worker1worker2

6.2.5 复制配置文件

# 如果设置了端口以及私钥# 加上 -P 端口 -i 私钥scp /usr/local/hadoop/etc/hadoop/* worker1:/usr/local/hadoop/etc/hadoop/scp /usr/local/hadoop/etc/hadoop/* worker2:/usr/local/hadoop/etc/hadoop/

7 启动

7.1 格式化HDFS

在Master中,首先格式化HDFS

cd /usr/local/hadoopbin/hdfs namenode -format

如果配置文件没错的话就格式化成功了。

7.2 hadoop-env.sh

还是在Master中,修改/usr/local/hadoop/etc/hadoop/hadoop-env.sh,末尾添加:

HDFS_DATANODE_USER=rootHDFS_NAMENODE_USER=rootHDFS_SECONDARYNAMENODE_USER=root

7.3 启动

首先Master开放9000以及9870端口(一般安全组开放即可,如果开启了防火墙firewalld/iptables则添加相应规则),并在Master节点中启动:

sbin/start-dfs.sh

浏览器输入:

MasterIP:9870

即可看到如下页面:

28339aba450e076ec626482dc807c4e3.png

在这里插入图片描述

如果看到Live Nodes数量为0请查看Worker的日志,这里发现是端口的问题:

1e1392bbeb6516290fa5ac675ef53dde.png

在这里插入图片描述

并且在配置了安全组,关闭了防火墙的情况下还是如此,则有可能是Host的问题,可以把Master节点中的:

# /etc/hosts127.0.0.1 master

删去,同样道理删去两个Worker中的:

# /etc/hosts127.0.0.1 worker1127.0.0.1 worker2

8 YARN

8.1 环境变量

修改/usr/local/hadoop/etc/hadoop/hadoop-env.sh,添加:

export YARN_RESOURCEMANAGER_USER=rootexport YARN_NODEMANAGER_USER=root

8.2 YARN配置

在两个Worker节点中修改/usr/local/hadoop/etc/hadoop/yarn-site.xml:

 yarn.resourcemanager.hostname master

8.3 开启YARN

Master节点中开启YARN:

cd /usr/local/hadoopsbin/start-yarn.sh

同时Master的安全组开放8088以及8031端口。

8.4 测试

浏览器输入:

MasterIP:8088

应该就可以访问如下页面了:

6bd72b47e8123d312031c7b2d4608e94.png

在这里插入图片描述

至此集群正式搭建完成。

9 参考

  • 博客园-HDFS之五:Hadoop 拒绝远程 9000 端口访问
  • How To Set Up a Hadoop 3.2.1 Multi-Node Cluster on Ubuntu 18.04 (2 Nodes)
  • How to Install and Set Up a 3-Node Hadoop Cluster

- END -

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值