要通过web页面查看运行日志,需要启动两个东西
hadoop启动jobhistoryserver和spark的history-server.
相关配置文件:
etc/hadoop/mapred-site.xml
<!--配置jobhistory的地址和web管理地址-->
<property>
<name>mapreduce.jobhistory.address</name>
<value>spark-master:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>spark-master:19888</value>
</property>
yarn-site.xml
<!-- 是否开启聚合日志 -->
<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>
<!-- 配置日志服务器的地址,work节点使用 -->
<property>
<name>yarn.log.server.url</name