Spark的一个经典问题(1个Core5个Executor和5个Core1个Executor有什么区别)

Spark的一个经典问题(1个Core5个Executor和5个Core1个Executor有什么区别)

一、问题分析

1.1先思考两个问题

1个Core VS 5个Core 有什么区别?在spark中如何用到Core

1个Executor VS 5个Executor 有什么区别?在spark中如何使用Executor?

1.2再思考两个问题

什么是IO密集?

什么是计算密集?

二、上述两种方式 如何选择

案例1

数据量10亿条,什么逻辑运算都不做处理,只是写到hdfs中,该选择哪种方式?

逻辑运算很少,说明不需要很多的Core,但是数据量很大,要写到hdfs中,io就成为了本案例的瓶颈,这种场景属于IO密集

那么就应该选择 1个core5个executor

这里举一个形象的例子,一个牧羊人把十万只羊赶到10公里外的羊圈,一次可以赶1万只,要赶十次,如果牧羊人可以一次赶十个一万只(十万只),那么就需要赶一次!

案例2

数据量1千条,逻辑运算超级复杂,该选择哪种方式?

逻辑运算超级复杂,如果想要加快计算,那么就需要更多的资源,cpu就成了本案例的瓶颈,这种场景属于计算密集

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值