Hadoop文件配置_输什么进入配置hadoop文件-CSDN博客

本文链接：https://blog.csdn.net/qq_38620833/article/details/85108641

文中的master为域名，需替换为自己的老大名称

切换到hadoop的文件目录下

cd hadoop292/hadoop

进入配置文件夹

cd /etc/hadoop

需要对5个模块进行配置
1.Hadoop的工作环境hadoop-env.sh,配置JAVA环境变量，最好指定路径

export JAVA_HOME=/usr/local/jdk180

2.对Hadoop的通用配置文件core-site.xml

<configuration>
    <property>
        <name>fs.defaultFS</name>     <-- 指定分布式系统 -->
        <value>hdfs://master:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>   <!-- 工作路径 -->
        <value>file:/home/hadoop/hadoop292/tmp</value>
    </property>
</configuration>

3.对Hdfs的配置hdfs-site.xml

<configuration>
        <!-- 设置namenode的http通讯地址 -->
        <property>
                <name>dfs.namenode.secondary.http-address</name>
                <value>master:50090</value>
        </property>
        <!-- 设置hdfs副本数量 -->
        <property>
                <name>dfs.replication</name>
                <value>3</value>     <!--工作环境一般3个，伪分布式1个-->
        </property>
         <!-- 设置namenode存放的路径 -->
        <property>
                <name>dfs.namenode.name.dir</name>
                <value>file:/home/hadoop/hadoop292/tmp/dfs/name</value>
        </property>
         <!-- 设置datanode存放的路径 -->
        <property>
                <name>dfs.datanode.data.dir</name>
                <value>file:/home/hadoop/hadoop292/tmp/dfs/data</value>
        </property>
</configuration>

4.对分布式计算mapreduce进行配置

<configuration>
        <!-- 通知框架MR使用YARN去跑，不指定变单机版 -->
        <property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value>
        </property>
        <property>
                <name>mapreduce.jobhistory.address</name>
                <value>master:10020</value>
        </property>
        <property>
                <name>mapreduce.jobhistory.webapp.address</name>
                <value>master:19888</value>
        </property>
</configuration>

5.配置yarn-site.xml

<configuration>
 <!-- 设置 resourcemanager 在哪个节点，指定老大在哪里-->
<!-- Site specific YARN configuration properties -->
        <property>
                <name>yarn.resourcemanager.hostname</name>
                <value>master</value>
        </property>
         <!-- reducer取数据的方式的机制是mapreduce_shuffle（也就这一种 -->
        <property>
                <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
        </property>
</configuration>

6.配置工作的节点，在slaves里