6台服务器集群配置文档

最新推荐文章于 2023-07-29 19:21:06 发布

鸿儒之观

最新推荐文章于 2023-07-29 19:21:06 发布

阅读量346

点赞数

分类专栏：大数据

本文链接：https://blog.csdn.net/zhijunming/article/details/107642760

版权

大数据专栏收录该内容

18 篇文章 1 订阅

订阅专栏

6台服务器集群部署文档

一,集群部署规划

服务器号	102	103	104	105	106	107
HDFS	NN	2NN	DN	DN	DN
YARN			NM	NM	NM	RM
Log		HistoryServer

二,文件的配置

1,核心文件的配置 core-site.xml

<!-- 指定NameNode的地址 -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://hadoop102:9820</value>
</property>
<!-- 指定hadoop数据的存储目录 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/module/hadoop-3.1.3/data</value>
</property>

<!-- 配置HDFS网页登录使用的静态用户为atguigu -->
    <property>
        <name>hadoop.http.staticuser.user</name>
        <value>atguigu</value>
</property>

<!-- 配置该atguigu(superUser)允许通过代理访问的主机节点 -->
    <property>
        <name>hadoop.proxyuser.atguigu.hosts</name>
        <value>*</value>
</property>
<!-- 配置该atguigu(superUser)允许通过代理用户所属组 -->
    <property>
        <name>hadoop.proxyuser.atguigu.groups</name>
        <value>*</value>
</property>
<!-- 配置该atguigu(superUser)允许通过代理的用户-->
    <property>
        <name>hadoop.proxyuser.atguigu.groups</name>
        <value>*</value>
</property>

2,HDFS文件的配置 hdfs-site.xml

<!-- nn web端访问地址-->
	<property>
        <name>dfs.namenode.http-address</name>
        <value>hadoop102:9870</value>
    </property>
	<!-- 2nn web端访问地址-->
    <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>hadoop103:9868</value>
</property>

3,YARN文件的配置 yarn-site.xml

<!-- 指定MR走shuffle -->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
</property>
<!-- 指定ResourceManager的地址-->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>hadoop107</value>
</property>
<!-- 环境变量的继承 -->
    <property>
        <name>yarn.nodemanager.env-whitelist</name>
        <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
</property>
<!-- yarn容器允许分配的最大最小内存 -->
    <property>
        <name>yarn.scheduler.minimum-allocation-mb</name>
        <value>512</value>
    </property>
    <property>
        <name>yarn.scheduler.maximum-allocation-mb</name>
        <value>4096</value>
</property>
<!-- yarn容器允许管理的物理内存大小 -->
    <property>
        <name>yarn.nodemanager.resource.memory-mb</name>
        <value>4096</value>
</property>
<!-- 关闭yarn对物理内存和虚拟内存的限制检查 -->
    <property>
        <name>yarn.nodemanager.pmem-check-enabled</name>
        <value>false</value>
    </property>
    <property>
        <name>yarn.nodemanager.vmem-check-enabled</name>
        <value>false</value>
    </property>

4,MapReduce配置文件的配置 mapred.xml

<!-- 指定MapReduce程序运行在Yarn上 -->
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>

5,配置历史服务器 mapred-site.xml

<!-- 历史服务器端地址 -->
<property>
    <name>mapreduce.jobhistory.address</name>
    <value>hadoop102:10020</value>
</property>

<!-- 历史服务器web端地址 -->
<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>hadoop103:19888</value>
</property>

6,配置日志聚集 yarn-site.xml

<!-- 开启日志聚集功能 -->
<property>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
</property>
<!-- 设置日志聚集服务器地址 -->
<property>  
    <name>yarn.log.server.url</name>  
    <value>http://hadoop103:19888/jobhistory/logs</value>
</property>
<!-- 设置日志保留时间为7天 -->
<property>
    <name>yarn.log-aggregation.retain-seconds</name>
    <value>604800</value>
</property>

7,配置workers

hadoop104
hadoop105
hadoop106

8,添加白名单和黑名单

在NameNode节点的/opt/module/hadoop-3.1.3/etc/hadoop目录下分别创建whitelist 和blacklist文件

touch whitelist
touch blacklist

(1)whitelist编写和worker一致,如下内容

hadoop104
hadoop105
hadoop106

(2)blacklist暂时不写
(3)在hdfs-site.xml添加

<!-- 白名单 -->

<property>

	<name>dfs.hosts</name>

	<value>/opt/module/hadoop-3.1.3/etc/hadoop/whitelist</value>

</property>

<!-- 黑名单 -->

<property>

	<name>dfs.hosts.exclude</name>

	<value>/opt/module/hadoop-3.1.3/etc/hadoop/blacklist</value>

</property>

9,提前考虑DataNo在这里插入代码片de多目录配置(注意DataNode多目录要配置到不同磁盘中才有意义)

在hdfs-site.xml中修改

<property>
        <name>dfs.datanode.data.dir</name>    <value>file://${hadoop.tmp.dir}/dfs/data1,file://${hadoop.tmp.dir}/dfs/data2</value>
 </property>

鸿儒之观

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
6台服务器集群配置文档

6台服务器集群部署文档一,集群部署规划服务器号102103104105106107HDFSNN2NNDNDNDNYARNNMNMNMRMLogHistoryServer二,文件的配置1,核心文件的配置 core-site.xml <property> <name>fs.defaultFS</name>
复制链接

扫一扫