spark partition,task,core,等等对应关系

最新推荐文章于 2022-08-31 22:39:32 发布

q996676479

最新推荐文章于 2022-08-31 22:39:32 发布

阅读量3.5k

点赞数

分类专栏： Spark Scala 文章标签： Spark FenBuShi

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/q996676479/article/details/80098946

版权

Spark 同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

用户应用new SparkContext后，集群就会为在Worker上分配executor,但是增加executor的时候需要考虑好内存消耗，因为一台机器的内存分配给越多的executor，每个executor的内存就越小，以致出现过多的数据spill over甚至out of memory的情况。CPU的core数量，每个executor可以占用一个或多个core，可以通过观察CPU的使用率变化来了解计算资源的使用情况，如此根据CPU的使用情况来分配executor数量，没有固定分配数量模式。

一个rdd分成几个partition，则有几个task，task被分配到节点中，每个节点的executor有几个core，则有几个task可以被并行执行，最大并行度即为节点数*core(虚拟核，并不是每个节点的cpu物理核，但一般虚拟核<=物理核) 。

假设：有5个节点，每个节点的executor有2个core；有1万条数据组成一个rdd，分成10个partition，则有10个task 。则每个节点分配到两个task并行执行。

https://www.zhihu.com/question/33270495?sort=created

作者：麦田
链接：https://www.zhihu.com/question/33270495/answer/82661639

来源：知乎

MongoDB 中导入csv文件到MongoDB

mongoimport -d test -c test --type csv --headerline --file C:\Users\Administrator.WINDOWS-S1SDTPC\IdeaProjects\ItemBasedRecom\data\ratings.csv

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

q996676479 CSDN认证博客专家 CSDN认证企业博客

码龄9年

3: 原创

66万+: 周排名

204万+: 总排名

1万+: 访问

: 等级

183: 积分

1: 粉丝

7: 获赞

2: 评论

12: 收藏

私信

关注

热门文章

分类专栏

python numpy 1篇
Spark 1篇
Scala 1篇
python 1篇
j
d's
m
machine learing

最新评论

python 不确定行数情况下多行输入
舒寒KIGA: def new_file(name): contents=input('请输入文件内容:') stopword = '' str = '' for line in iter(input, stopword): str += line + '\n' with open(name,'w') as file_object: file_object.write(contents) with open(name,'r') as file_object: print('name:'+ name + '\n' + 'contents:' + file_object.read()) name=input('请输入新文件名称：') new_file(name) 虽然input的时候回车是可以继续输了但是print contents还是只有第一行的内容是为什么鸭 [code=python] [/code]
spark partition,task,core,等等对应关系
herriman: 感觉task就是把partition数据包装成一个runnable对象而已，所以是一对一。core如同线程池中的线程数。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。