Hadoop分布式集群搭建

此处以centos01、02、03为例
A-配置各节点无密钥登录
1、查看ssh版本号,如若没有ssh,将其安装
ssh -V
2、在centos01中配置ssh免秘钥登录,生成秘钥文件
在这里插入图片描述
3、在centos01中将秘钥信息加入到授权文件中
在这里插入图片描述
4、在centos02、03中执行1、2步骤,然后将秘钥文件远程拷贝到centos01中(记得要重命名)
centos02(作参考)
在这里插入图片描述
在这里插入图片描述
centos03(作参考)
在这里插入图片描述
在这里插入图片描述
在centos01中查看一下,确定拷贝完成
在这里插入图片描述
5、验证三台机器的免秘钥登录配置成功
在这里插入图片描述
在这里插入图片描述
成功

B-搭建
1、上传Hadoop压缩包,解压,(用xftp)
上传Hadoop至/opt/softwares
在这里插入图片描述
解压至/opt/modules
在这里插入图片描述
查看一下,有了
在这里插入图片描述
C-配置Hadoop环境变量
1、Hadoop所有的配置文件都在/etc/hadoop中,在hadoop-env.sh文件,mapred-env.sh文件,yarn-env.sh文件中加入环境变量
export JAVA_HOME=/opt/modules/jdk1.8.0_144

D-配置HDFS
1、修改配置文件core-site.xml
在这里插入图片描述
在这里插入图片描述
2、修改配置文件hdfs-site.xml
replication:文件在HDFS中的副本数
name:HDFS名称节点在本地文件系统的存放位置
data:HDFS数据节点在本地文件系统的存放位置
在这里插入图片描述
在这里插入图片描述
3、修改slaves文件,添加三个节点
在这里插入图片描述
在这里插入图片描述
E-配置Yarn
1、复制mapred-site.xml.template文件为mapred-site.xml
在这里插入图片描述
2、修改mapred-site.xml文件
在这里插入图片描述在这里插入图片描述
3、修改yarn-site.xml文件,添加以下内容
在这里插入图片描述
在这里插入图片描述
4、拷贝Hadoop安装文件到其他主机
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
F-配置Hadoop环境变量(为了能在任何目录下执行Hadoop命令)
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
G-启动Hadoop
1、格式化NameNode,初始HDFS系统目录和文件
在这里插入图片描述
在这里插入图片描述
2、启动
在这里插入图片描述
在这里插入图片描述
H-查看各节点进程
jps

I-测试HDFS
1、在centos01节点的HDFS根目录创建文件夹,名为input,并将/opt/data目录下的一个名为自己学号.txt文件(文件中输入两行话:第一行:Hello, Hadoop!,第二行:My name is pinyin)上传到新建的input文件夹中
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
2、在网页中查看HDFS的NameNode信息
在这里插入图片描述
G-测试MapReduce
在网页中查看并打开之前上传的txt文件,然后运行Hadoop自带的MapReduce单词的计数程序,统计数量
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
测试结束,没有问题,Hadoop集群搭建成功

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
搭建Hadoop分布式集群,你需要按照以下步骤进行操作: 1. 安装Java:Hadoop是用Java编写的,所以首先需要安装Java环境。确保你的系统上已经安装了Java,并设置好JAVA_HOME环境变量。 2. 下载Hadoop:从Apache官网下载最新版本的Hadoop。选择一个稳定版本并下载压缩包。 3. 解压Hadoop压缩包:将下载的压缩包解压到你选择的目录中。 4. 配置Hadoop:进入解压后的Hadoop目录,编辑`etc/hadoop/core-site.xml`文件,设置以下属性: ``` <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> ``` 编辑`etc/hadoop/hdfs-site.xml`文件,设置以下属性: ``` <property> <name>dfs.replication</name> <value>3</value> </property> ``` 编辑`etc/hadoop/mapred-site.xml.template`文件,设置以下属性: ``` <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> ``` 将该文件另存为`etc/hadoop/mapred-site.xml`。 5. 配置主机文件:在`etc/hadoop/workers`文件中,列出你希望成为集群节点的主机名或IP地址。每行一个主机。 6. 配置SSH免密码登录:确保你可以通过SSH免密码登录到所有集群节点。可以使用`ssh-keygen`命令生成SSH密钥对,并将公钥拷贝到所有节点的`~/.ssh/authorized_keys`文件中。 7. 格式化HDFS:运行以下命令来格式化HDFS: ``` bin/hdfs namenode -format ``` 8. 启动Hadoop集群:运行以下命令启动Hadoop集群: ``` sbin/start-dfs.sh sbin/start-yarn.sh ``` 运行以上命令后,你的Hadoop分布式集群就会启动起来。 这是一个基本的Hadoop分布式集群搭建过程,你可以根据自己的需求进行进一步的配置和调优。还有其他一些配置文件和命令可以帮助你管理和监控Hadoop集群,你可以查阅Hadoop官方文档来获取更多详细信息。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值