hadoop3.1.3版本集群环境搭建

Cool563

已于 2023-03-18 17:20:14 修改

阅读量173

点赞数 1

分类专栏： hadoop 文章标签： hadoop Powered by 金山文档

于 2023-03-18 17:17:23 首次发布

本文链接：https://blog.csdn.net/weixin_67775126/article/details/129639431

版权

hadoop 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

修改/etc/hosts文件中配置主机ip映射

这样我们可以通过调用master获取本地ip

配置/hadoop/etc/hadoop/works文件,注意不能含有空格，空行之类的

配置hadoop的4大配置文件，

可以通过以下提供的默认配置文件进行查找所需配置修改属性

这里我们只做普通集群部署，不做具体调优

只需要在/hadoop/etc/hadoop/修改以下配置文件即可，默认配置文件只供参考，不可修改

（1）core-site.xml配置文件

默认文件地址：share/doc/hadoop/hadoop-project-dist/hadoop-common/core-default.xml

文件内容如下：

<?xml version="1.0"encoding="UTF-8"?>

<?xml-stylesheettype="text/xsl" href="configuration.xsl"?>

<name>fs.defaultFS</name>

<value>hdfs://master:8020</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/opt/module/hadoop/data</value>

</property>

<name>hadoop.http.staticuser.user</name>

</property>

</configuration>

（2）HDFS配置文件

配置hdfs-site.xml

默认配置文件地址：share/doc/hadoop/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml

文件内容如下：

<?xml version="1.0"encoding="UTF-8"?>

<?xml-stylesheettype="text/xsl" href="configuration.xsl"?>

<name>dfs.namenode.http-address</name>

<value>master:9870</value>

</property>

<name>dfs.namenode.secondary.http-address</name>

<value>slave2:9868</value>

</property>

</configuration>

（3）YARN配置文件

配置yarn-site.xml

默认配置文件地址：share/doc/hadoop/hadoop-yarn/hadoop-yarn-common/yarn-default.xml

文件内容如下：

<?xmlversion="1.0" encoding="UTF-8"?>

<?xml-stylesheettype="text/xsl" href="configuration.xsl"?>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.resourcemanager.hostname</name>

<value>slave1</value>

</property>

<name>yarn.nodemanager.env-whitelist</name>

<value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>

</property>

<name>yarn.log-aggregation-enable</name>

</property>

<name>yarn.log.server.url</name>

<value>http://master:19888/jobhistory/logs</value>

</property>

<name>yarn.log-aggregation.retain-seconds</name>

</property>

</configuration>

（4）MapReduce配置文件

配置mapred-site.xml

默认配置文件地址：share/doc/hadoop/hadoop-mapreduce-client/hadoop-mapreduce-client-core/mapred-default.xml

文件内容如下：

<?xml version="1.0"encoding="UTF-8"?>

<?xml-stylesheettype="text/xsl" href="configuration.xsl"?>

<name>mapreduce.framework.name</name>

</property>

<name>mapreduce.jobhistory.address</name>

<value>slave1:10020</value>

</property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>slave1:19888</value>

</property>

</configuration>

常用端口号说明

端口名称	Hadoop2.x	Hadoop3.x
NameNode内部通信端口	8020 / 9000	8020 / 9000/9820
NameNode HTTP UI	50070	9870
MapReduce查看执行任务端口	8088	8088
历史服务器通信端口	19888	19888

如果使用root启动集群，需要配置一下sbin的启动关闭命令

Start-dfs.sh stop-dfs.sh加入以下配置

HDFS_DATANODE_USER=root

HADOOP_SECURE_DN_USER=hdfs

HDFS_NAMENODE_USER=root

HDFS_SECONDARYNAMENODE_USER=root

Stop-yarn.sh stop-yarn.sh加入以下配置

YARN_RESOURCEMANAGER_USER=root

HADOOP_SECURE_DN_USER=yarn

YARN_NODEMANAGER_USER=root

最终操作

需要将以上部署，同步或分发到另外两台虚拟机上，具体命令如下

分发命令：

scp -r /hadoop root@slave1:/

同步命令：

rsync -avh /hadoop root@slave1:/hadoop

在master节点进行格式化命令

hdfs namenode -format

启动集群命令

start-all.sh

愿以上可帮助各位！

Cool563

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

hadoop3.1.3版本集群环境搭建

修改/etc/hosts文件中配置主机ip映射

配置/hadoop/etc/hadoop/works文件,注意不能含有空格，空行之类的

配置hadoop的4大配置文件，

（1）core-site.xml配置文件

（2）HDFS配置文件

（3）YARN配置文件

（4）MapReduce配置文件

常用端口号说明

如果使用root启动集群，需要配置一下sbin的启动关闭命令

最终操作