Yarn web proxy服务介绍
Yarn web proxy是YARN的一部分。默认情况下,它将作为资源管理器(RM)的一部分运行,但可以配置为以独立模式运行。代理的原因是为了缓解RM访问请求压力,也可以减少通过YARN进行基于网络的攻击的可能性。
问题描述
在spark on yarn模式时,在yarn的web界面上点击ApplicationMaster无法看到SparkWebUi界面,需要跑完后,通过history页面才能看到,不能看到实时的web监控;
问题原因
在RM中,它可以启动一个单独的进程,对外提供web服务,从resourcemanager上点击正在执行的app,会跳转到yarn.web-proxy.address,这里展示正在执行的job信息,job执行结束后,会跳转到historyserver上;如果没有配置yarn.web-proxy.address,则这个功能会集成到RM中。
问题解决
配置Yarn的 web proxy服务,配置如下:
- 在hadoop集群的所有节点yarn-site.xml中加入如下配置
<property>
<name>yarn