大数据学习笔记(三)-yarn
配置yarn并允许MapReduce
## 配置yarn-env.sh 修改JAVA_HOME
export JAVA_HOME=/opt/module/jdk1.8.0_51
## 配置yarn-site.xml
<!-- Reducer获取数据的方式 -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<!-- 指定YARN的ResourceManager的地址 -->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>hadoop101</value>
</property>
##配置:mapred-env.sh 修改JAVA_HOME
export JAVA_HOME=/opt/module/jdk1.8.0_51
##配置: (对mapred-site.xml.template重新命名为) mapred-site.xml
<!-- 指定MR运行在YARN上 -->
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
## 启动resourcemanager和nodemanager
sbin/yarn-daemon.sh start resourcemanager
sbin/yarn-daemon.sh start nodemanager
## 运行wordcount案例
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /user/root/input /user/root/output
history历史服务器与日志聚集
日志聚集概念:应用运行完成以后,将程序运行日志信息上传到HDFS系统上。
日志聚集功能好处:可以方便的查看到程序运行详情,方便开发调试。
注意:开启日志聚集功能,需要重新启动NodeManager 、ResourceManager和HistoryManager。
## 配置yarn-site.xml
<!-- 日志聚集功能使能 -->
<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>
<!-- 日志保留时间设置7天 -->
<property>
<name>yarn.log-aggregation.retain-seconds</name>
<value>604800</value>
</property>
### 重启nodemanager、resourcemanager、historyserver
### 删除HDFS上已经存在的输出文件
bin/hdfs dfs -rm -R /user/root/output
## 重新执行wordcount案例
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /user/root/input /user/root/output
到此,启动yarn,运行MapReduce,在yarn上执行wordcount案例,搭建日志服务器,配置日志聚集已完成,不过,这些都是在单台服务器上运行的,接下来,将在多台服务器上搭建集群。配置一套hadoop集群。