Hadoop集群环境搭建详细步骤

最新推荐文章于 2024-05-09 15:58:17 发布

codepeng

最新推荐文章于 2024-05-09 15:58:17 发布

阅读量1.6k

点赞数 2

分类专栏： Hadoop 文章标签： hadoop集群大数据 hadoop

本文链接：https://blog.csdn.net/qiao0809/article/details/51014465

版权

Hadoop 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

Hadoop集群环境搭建详细步骤

一、准备工作

1、三台机器，配置hosts，并确保java环境jdk1.7.0_72

192.168.5.231 ubuntu231

192.168.5.232 ubuntu232

192.168.5.233 ubuntu233

2、ubuntu231选择作为主节点Master

下载hadoop-2.6.0安装包

二、解压

解压安装包到指定路径

这里的全路径是 /home/spark

三、ssh免密配置

$ ssh-keygen -t rsa

$ ssh-copy-id -i ~/.ssh/id_rsa.pub 要免密码的机器的IP

四、环境变量配置

spark@ubuntu231:~$ vi .profile

五、配置hadoop

在配置之前先在本地文件系统创建以下文件夹~/hadoop2.6.0/tmp、~/hadoop2.6.0/dfs/data、~/hadoop2.6.0/dfs/name

主要配置在hadoop-2.6.0/etc/hadoop目录下的七个文件

hadoop-env.sh

yarn-env.sh

slaves

core-site.xml

hdfs-site.xml

mapred-site.xml

yarn-site.xml

1、配置 hadoop-env.sh文件-->修改JAVA_HOME

export JAVA_HOME=/home/spark/jdk1.7.0_72

2、配置 yarn-env.sh 文件-->>修改JAVA_HOME

export JAVA_HOME=/home/spark/jdk1.7.0_72

3、配置slaves文件-->>增加slave节点

ubuntu232

ubuntu233

4、配置 core-site.xml文件-->>增加hadoop核心配置（hdfs文件端口是9000、file:/home/spark/hadoop-2.6.0/tmp）

<name>fs.defaultFS</name>

</property>

<name>io.file.buffer.size</name>

</property>

<name>hadoop.tmp.dir</name>

<value>file:/home/spark/hadoop-2.6.0/tmp</value>

<description>Abasefor other temporary directories.</description>

</property>

<name>hadoop.proxyuser.spark.hosts</name>

</property>

<name>hadoop.proxyuser.spark.groups</name>

</property>

</configuration>

5、配置 hdfs-site.xml 文件-->>增加hdfs配置信息（namenode、datanode端口和目录位置）

<name>dfs.namenode.secondary.http-address</name>

</property>

<name>dfs.namenode.name.dir</name>

<value>file:/home/spark/hadoop-2.6.0/dfs/name</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>file:/home/spark/hadoop-2.6.0/dfs/data</value>

</property>

<name>dfs.replication</name>

</property>

<name>dfs.webhdfs.enabled</name>

</property>

</configuration>

6、配置 mapred-site.xml 文件-->>增加mapreduce配置（使用yarn框架、jobhistory使用地址以及web地址）

<name>mapreduce.framework.name</name>

</property>

<name>mapreduce.jobhistory.address</name>

</property>

<name>mapreduce.jobhistory.webapp.address</name>

</property>

</configuration>

7、配置 yarn-site.xml 文件-->>增加yarn功能

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<name>yarn.resourcemanager.address</name>

</property>

<name>yarn.resourcemanager.scheduler.address</name>

</property>

<name>yarn.resourcemanager.resource-tracker.address</name>

</property>

<name>yarn.resourcemanager.admin.address</name>

</property>

<name>yarn.resourcemanager.webapp.address</name>

</property>

</configuration>

六、将配置好的hadoop文件copy到另外两台slave机器上（请保持目录一致）

scp -r hadoop-2.6.0/ spark@192.168.5.232:~/

scp -r hadoop-2.6.0/ spark@192.168.5.233:~/

七、格式化namenode

spark@ubuntu231:~$ cd hadoop-2.6.0/

spark@ubuntu231:~/hadoop-2.6.0$ ./bin/hdfs namenode -format

spark@ubuntu232:~$ cd hadoop-2.6.0/

spark@ubuntu232:~/hadoop-2.6.0$ ./bin/hdfs namenode -format

spark@ubuntu233:~$ cd hadoop-2.6.0/

spark@ubuntu233:~/hadoop-2.6.0$ ./bin/hdfs namenode -format

到此我们的hadoop已经配置完成了

codepeng

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop集群环境搭建详细步骤

Hadoop集群环境搭建详细步骤一、准备工作1、三台机器，配置hosts，并确保java环境jdk1.7.0_72192.168.5.231 ubuntu231192.168.5.232 ubuntu232192.168.5.233 ubuntu2332、ubuntu231选择作为主节点Master下载hadoop-2.6.0安装包二、解压
复制链接

扫一扫