将Spark Application提交运行到YARN集群上,至关重要,企业中大多数都是运行在YANR上,文档:launching-spark-on-yarn
spark on yarn 模式官方文档说明:
running-on-yarn
running-on-yarn#configuration
同时注意,如果我们的spark程序是运行在yarn上面的话,那么我们就不需要spark 的集群了,我们只需要找任意一台机器配置我们的spark的客户端提交任务到yarn集群上面去即可。
1. 属性配置
当Spark Application运行到YARN上时,在提交应用时指定master为yarn即可,同时需 要告知YARN集群配置信息(比如ResourceManager地址信息),此外需要监控Spa