1.Spark基于Standalone提交任务
1).client
命令:
./spark-submit --master spark://node1:7077 --class ... jar ... 参数
./spark-submit --master spark://node1:7077 --deploy-mode client --class .. jar .. 参数
过程:
a).在客户端提交Spark应用程序,会在客户端启动Driver。
b).客户端向Master申请资源,Master找到资源返回。
c).Driver发送task。
注意:
client方式提交任务,在客户端提交多个application,客户端会为每个application都启动一个Driver,Driver与集群Worker节点有大量通信,这样会造成客户端网卡流量激增。client方式提交任务适用于程序测试,不适用于真实生产环境。在客户端可以看到task执行情况和计算结果。
2).cluster
命令:
./spark-submit --master spark://node1:7077 --deploy-mode cluster --cla