Hadoop集群的搭建

本文详细描述了如何在Linux环境中安装和配置Hadoop3.1.4,涉及目录操作、配置文件编辑、环境变量设置以及启动停止服务等关键步骤,包括HDFS、MapReduce和Yarn组件的配置。
摘要由CSDN通过智能技术生成

1、进入/opt/module/ hadoop-3.1.4/

2、建立data文件夹

3、编辑 vi core-site.xml

         hdfs-----分布式文件系统   namenode datanode

        MapReduce---分布式计算框架

        Yarn-----资源调度管理平台 rescourcemanager nodemanager

masterslave1   slave2
 namenode  datanodedatanone
datanonerescourcemanagernodemanager
nodemanagernodemanage secondarynamenode

4、编辑vi core-site.xml、

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:8020</value>
</property>
<property>
<!--指定hdoop数据的存储位置-->
<name>hadoop.tmp.dir</name>
<value>/opt/module/hadoop-3.1.4/data</value>
</property>
<property>
<!--指定hdoop数据的存储位置-->
<name>hadoop.http.staticuser.user</name>
<value>root</value>
</property>
</configuration>

    

5、编辑vi hdfs-site.xml

<configuration>
<property>
<name>dfs.namenode.http-address</name>
<value>master:9870</value>
</property>
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>slave2:9868</value>
</property>
<property>
<name>dfs.permissions</name>    
<value>false</value>
</property>
</configuration>

6、编辑vi mapred-site.xml

<configuration>
<!-- 指定 MapReduce 程序运行在 Yarn 上 -->
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<!-- 历史服务器端地址 -->
<property>
<name>mapreduce.jobhistory.address</name>
<value>master:10020</value>
</property>
<!-- 历史服务器 web 端地址 -->
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>master:19888</value>
</property>
</configuration>

7、编辑vi yarn-site.xml(<name>yarn.application.classpath的<value>中的内容通过hadoop classpath查询)


<configuration>

<!-- Site specific YARN configuration properties -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<!-- 指定 ResourceManager 的地址-->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>slave1</value>
</property>
<property>
<name>yarn.application.classpath</name>
<value>
/opt/module/hadoop-3.1.4/etc/hadoop:/opt/module/hadoop-3.1.4/share/hadoop/common/lib/*:/opt/module/hadoop-3.1.4/share/hadoop/common/*:/opt/module/hadoop-3.1.4/share/hadoop/hdfs:/opt/module/hadoop-3.1.4/share/hadoop/hdfs/lib/*:/opt/module/hadoop-3.1.4/share/hadoop/hdfs/*:/opt/module/hadoop-3.1.4/share/hadoop/mapreduce/lib/*:/opt/module/hadoop-3.1.4/share/hadoop/mapreduce/*:/opt/module/hadoop-3.1.4/share/hadoop/yarn:/opt/module/hadoop-3.1.4/share/hadoop/yarn/lib/*:/opt/module/hadoop-3.1.4/share/hadoop/yarn/*
</value>
</property>
<!--是否将对容器实施虚拟内存限制-->
<property>
<name>yarn.nodemanager.vmem-check-enabled</name>
<value>false</value>
</property>
</configuration>

8、编辑vi worker

master
slave1
slave2

9、修改环境变量设置(vi /etc/profire.d/my_env.sh)

#jdk环境变量
export JAVA_HOME=/opt/module/jdk1.8.0_161
export PATH=$JAVA_HOME/bin:$PATH
#hadoop环境变量
export HADOOP_HOME=/opt/module/hadoop-3.1.4
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH



export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_JOURNALNODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root

10、复制前四行于start-dfs.sh、stop-dfs.sh中的头部

        复制后两行于start-yarn、stop-yarn.sh中的头部

11、hdfs namenode-format        文件系统格式化

12、开启Hadoop平台

        start-dfs.sh(主节点:master)        启动hdfs

        start-yarn.sh(主节点:slave1)        启动yarn

        mapred --daemon start historyserver        启动日志服务

13、安全模式

        hdfs dfsadmin -safemode get        查看安全模式状态

        hdfs dfsadmin -safemode enter        开启安全模式

        hdfs dfsadmin -safemode leave        关闭安全模式

14、hdfs dfsadmin -report        查看HDFS系统资源信息

        hdfs dfsadmin -report -live        查看在线节点信息

        hdfs dfsadmin -report -dead        查看宕机节点信息

  • 4
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值