文中的master为域名,需替换为自己的老大名称
切换到hadoop的文件目录下
cd hadoop292/hadoop
进入配置文件夹
cd /etc/hadoop
需要对5个模块进行配置
1.Hadoop的工作环境hadoop-env.sh,配置JAVA环境变量,最好指定路径
export JAVA_HOME=/usr/local/jdk180
2.对Hadoop的通用配置文件core-site.xml
<configuration>
<property>
<name>fs.defaultFS</name> <-- 指定分布式系统 -->
<value>hdfs://master:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name> <!-- 工作路径 -->
<value>file:/home/hadoop/hadoop292/tmp</value>
</property>
</configuration>
3.对Hdfs的配置hdfs-site.xml
<configuration>
<!-- 设置namenode的http通讯地址 -->
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>master:50090</value>
</property>
<!-- 设置hdfs副本数量 -->
<property>
<name>dfs.replication</name>
<value>3</value> <!--工作环境一般3个,伪分布式1个-->
</property>
<!-- 设置namenode存放的路径 -->
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/home/hadoop/hadoop292/tmp/dfs/name</value>
</property>
<!-- 设置datanode存放的路径 -->
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/home/hadoop/hadoop292/tmp/dfs/data</value>
</property>
</configuration>
4.对分布式计算mapreduce进行配置
<configuration>
<!-- 通知框架MR使用YARN去跑,不指定变单机版 -->
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>mapreduce.jobhistory.address</name>
<value>master:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>master:19888</value>
</property>
</configuration>
5.配置yarn-site.xml
<configuration>
<!-- 设置 resourcemanager 在哪个节点,指定老大在哪里-->
<!-- Site specific YARN configuration properties -->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
</property>
<!-- reducer取数据的方式的机制是mapreduce_shuffle(也就这一种 -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>
6.配置工作的节点,在slaves里
slave1
slave2