spark基于standalone模式提交任务和基于yarn模式提交任务的比较,spark的宽窄依赖,spark的计算模式等(图解+文字说明)

本文详细对比了Spark在Standalone和Yarn模式下client和cluster两种提交任务的方式,分析了各自的优缺点,并解释了Spark的宽窄依赖概念,以及Stage的组成和计算模式,探讨了提高Stage并行度的方法。
摘要由CSDN通过智能技术生成

 

    1.Spark基于Standalone提交任务
        1).client
            命令:
                ./spark-submit --master spark://node1:7077 --class ... jar ... 参数
                ./spark-submit --master spark://node1:7077 --deploy-mode client --class .. jar .. 参数
            过程:
                a).在客户端提交Spark应用程序,会在客户端启动Driver。
                b).客户端向Master申请资源,Master找到资源返回。
                c).Driver发送task。
            注意:
                client方式提交任务,在客户端提交多个application,客户端会为每个application都启动一个Driver,Driver与集群Worker节点有大量通信,这样会造成客户端网卡流量激增。client方式提交任务适用于程序测试,不适用于真实生产环境。在客户端可以看到task执行情况和计算结果。
                
        2).cluster
            命令:
                ./spark-submit --master spark://node1:7077 --deploy-mode cluster --cla

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值