大数据技术是多线程还是多进程,你知道吗?

        既是多进程也是多线程,原因如下:

        首先大数据技术区别于传统技术的核心在于分治思想就是分而治之,让原本只能在一台机器上去干的活给分摊到多台机器中,让每台机器都能够运行一个做这件事的子任务,而这个子任务就是进程,因为有多台机器一起参与运行所以是多进程,这个是利用了多台机器的计算能力;但是如果想进一步压榨每台机器的性能的话,就得在每一台机器上也运行多个子任务,而这个在每一台机器上运行多个子任务的方式就叫多线程。

        大数据开发用分布式计算引擎处理数据时如果分配多个executor,那么就会在多台机器上启动多个进程,而如果对一个executor分配多个CPU的话,那么就会在每一台机器上再次启动多个线程来进一步加速任务的执行,所以大数据技术一定是多进程和多线程的。

  • 6
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值