Spark的运行模式
1.spark运行模式的种类
无论是在哪儿提交Spark代码,每提交一个spark任务,都会开启一个driver,我们都有两种模式:
Client(客户端模式):代码在哪台机器上提交的,那台机器就会开启Driver线程。
Cluster(集群模式):Spark集群会在worker集群里面随机找一台机器,然后那一台就会开启一个Driver线程。
2.Spark运行模式的比较
Client模式的好处:调试程序的时候,我们一般都是会用client,如果你用client模式提交。打印出来的日志非常详细。
Client模式的坏处: 提交代码的这台服务器压力太大,压力太大了以后容易出问题。
Cluster模式的好处:把压力分散了
Cluster模式的坏处:打印出来的日志不详细
建议:我们调试程序的时候使用client模式,然我们开发完了以后,就使用cluster模式去提交。