Standalone模式两种提交任务方式

最新推荐文章于 2024-08-10 07:34:22 发布

秋雨ヾ

最新推荐文章于 2024-08-10 07:34:22 发布

阅读量400

点赞数

分类专栏： spark

本文链接：https://blog.csdn.net/weixin_45271668/article/details/106440465

版权

spark 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

1. Standalone-client提交任务方式

提交命令

./spark-submit
 --master spark://node1:7077 
 --class org.apache.spark.examples.SparkPi 
 ../lib/spark-examples-1.6.0-hadoop2.6.0.jar 
 1000

或者

./spark-submit
 --master spark://node1:7077
  --deploy-mode client 
  --class org.apache.spark.examples.SparkPi 
  ../lib/spark-examples-1.6.0-hadoop2.6.0.jar 
  100

执行原理图解
在这里插入图片描述
执行流程

client模式提交任务后，会在客户端启动Driver进程。
Driver会向Master申请启动Application启动的资源。
资源申请成功，Driver端将task发送到worker端执行。
worker将task执行结果返回到Driver端。

总结
client模式适用于测试调试程序。Driver进程是在客户端启动的，这里的客户端就是指提交应用程序的当前节点。在Driver端可以看到task执行的情况。生产环境下不能使用client模式，是因为：假设要提交100个application到集群运行，Driver每次都会在client端启动，那么就会导致客户端100次网卡流量暴增的问题。

2.Standalone-cluster提交任务方式

提交命令

./spark-submit 
--master spark://node1:7077 
--deploy-mode cluster
--class org.apache.spark.examples.SparkPi 
../lib/spark-examples-1.6.0-hadoop2.6.0.jar 
100

执行原理图解 在这里插入图片描述
执行流程
3. cluster模式提交应用程序后，会向Master请求启动Driver.
4. Master接受请求，随机在集群一台节点启动Driver进程。
5. Driver启动后为当前的应用程序申请资源。
6. Driver端发送task到worker节点上执行。
7. worker将执行情况和执行结果返回给Driver端。