一、YARN的配置
首先需要对YARN进行配置,使其支持Spark的Shuffle Service。
修改每台集群上的yarn-site.xml
:
- 修改
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle,spark_shuffle</value>
</property>
- 增加
<property>
<name>yarn.nodemanager.aux-services.spark_shuffle.class</name>
<value>org.apache.spark.network.yarn.YarnShuffleService</value>
</property>
<property>
<name>spark.shuffle.service.port</name>
<value>7337</value>
</property>
将$SPARK_HOME/lib/spark-1.5.2-yarn-shuffle.jar
拷贝到每台NodeManager的${HADOOP_HOME}/share/hadoop/yarn/lib/
下。
重启所有修改配置的节点。
二、Spark的配置
配置$SPARK_HOME/conf/spark-defaults.conf
,增加以下参数:
spark.shuffle.service.enabled true //启用External shuffle Se