本文介绍了Spark应用程序提交的三种模式:Client本地模式和Cluster集群模式,详细解析了standalone HA及spark on yarn环境下的提交,并讲解了常用Spark命令参数,如master、deploy-mode、driver-memory等,帮助企业理解如何优化Spark应用的资源配置。
摘要由CSDN通过智能技术生成
Client 本地模式 和 Cluster 集群模式 最本质的区别在于:Driver程序在哪里?
Client模式下的Drive就在提交Spark应用程序所在的机器上运行
Cluster模式下的Drive在集群的某台空闲的WorkerNode上运行
1、standalone HA 下的 client 本地模式,提交圆周率Spark应用程序(测试模式中使用)