java任务分解_Spark如何将切片分解为任务/执行者/工作者？

最新推荐文章于 2022-04-20 18:38:28 发布

番茄大王Z

最新推荐文章于 2022-04-20 18:38:28 发布

阅读量105

点赞数

文章标签： java任务分解

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_33855578/article/details/114235805

版权

1)我在哪里可以看到任务级别的详细信息？内部执行程序我没有看到任务分解，所以我可以看到切片对UI的影响 .

我不明白你的问题，因为从UI我们可以肯定看到分区的效果(或者你喜欢的切片) .

2)如何以编程方式查找上面的map函数的工作集大小？我假设它是n /切片(上面100000)

请详细说明您感兴趣的尺寸 . 如果你的意思是每个工作者消耗的内存量...每个Spark分区都有64MB所以...来自官方的Spark文档：

Spark prints the serialized size of each task on the master, so you can look at that to decide whether your tasks are too large; in general tasks larger than about 20 KB are probably worth optimizing.

3)执行程序运行的多个任务是在多个线程中顺序运行还是并行运行？

一个很好的来源是这个问题：

4)推理每个CPU 2-4片 . 我假设理想情况下我们应该调整SPARK_WORKER_INSTANCES以对应每个节点(在同构群集中)的核心数，以便每个核心获得自己的 Actuator 和任务(1：1：1)

主要目标不是让闲置的工作人员......一旦完成一项任务，在等待其他节点完成更长任务时总会有一些工作要做 . 如果(1：1：1)， Worker 就会闲着 .

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java任务分解_Spark如何将切片分解为任务/执行者/工作者？

1)我在哪里可以看到任务级别的详细信息？内部执行程序我没有看到任务分解，所以我可以看到切片对UI的影响 .我不明白你的问题，因为从UI我们可以肯定看到分区的效果(或者你喜欢的切片) .2)如何以编程方式查找上面的map函数的工作集大小？我假设它是n /切片(上面100000)请详细说明您感兴趣的尺寸 . 如果你的意思是每个工作者消耗的内存量...每个Spark分区都有64MB所以...来自官方的S...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。