spark on yarn 中的延迟调度(delay scheduler)

最新推荐文章于 2020-10-30 19:12:17 发布

VIP文章 CxCo

最新推荐文章于 2020-10-30 19:12:17 发布

阅读量8.7k

点赞数 1

分类专栏： spark yarn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq403977698/article/details/51084437

版权

延迟调度算法思想十分简单，为了实现data locality(即该task所需数据就在其运行的机器上)，会尽量将task分布到有其所需数据的机器或者jvm中去，如果机器或者jvm已被占用就进行延迟等待，直到该机器或者jvm可以运行该task或者超过等待时限则将task运行到其他机器上。

这个想法基于以下几点:

1.往往数据比程序要大得多，分布式上处理的数据都是GB为单位的，将程序放到数据所在机器去执行，大大减少网络传输时间。

2.在集群上面task一般都是运行时间较短的，即整个集群上面不断有task完成，释放其占用的资源，延迟调度的task能够有极大的机会获得分配。

总之，就是延迟调度节省的网络传输时间远远大于task等待花费的时间。

延迟调度的思想是相通的，本文讨论的是spark在yarn集群上的延迟调度情况，故分为两层，第一层是yarn的延迟调度，第二层则是spark内部的延迟调度。

1.yarn级别的Delay Scheduler

spark在yarn上面的Delay Scheduler其实就是觉得spark的executor分配在哪些NodeManager上面，这是由yarn根据application的输入文件而定。尽量将executor分布到有数据的NodeManager上。因为，在这一层上如果executor无法做到data locality，那么到了spark的级别分配task到executor的时候，更加无法实现data locality。

在yarn中配置yarn.

最低0.47元/天解锁文章

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
spark on yarn 中的延迟调度(delay scheduler)

延迟调度算法思想十分简单，为了实现data locality(即该task所需数据就在其运行的机器上)，会尽量将task分布到有其所需数据的机器或者jvm中去，如果机器或者jvm已被占用就进行延迟等待，直到该机器或者jvm可以运行该task或者超过等待时限则将task运行到其他机器上。这个想法基于以下几点:1.往往数据比程序要大得多，分布式上处理的数据都是GB为单位的，将程序放到数据所在机
复制链接

扫一扫

专栏目录

博客等级

码龄13年

48
原创

31
点赞

31
收藏

34
粉丝

关注

私信

热门文章

分类专栏

转载 12篇
stl 2篇
软件工程 1篇
ACM 40篇
个人感悟
杂谈
机器学习 4篇
python 7篇
storm 10篇
推荐系统与算法 3篇
hbase 1篇
jstorm 2篇
spark 6篇
转载dv
scala 2篇
hive 1篇
yarn 2篇
C语言 1篇

最新评论

logistic回归与牛顿方法的python实现（standford公开课程小作业）
NoBloodyman: 博主，这个课程是吴恩达的课程吗
numpy中的ndarray方法和属性
chucksonwheel 回复 scarftree: 创建一个n行m列的ndarray: np.empty((n,m))
numpy中的ndarray方法和属性
scarftree: 请问应该如何创建一个空的ndarray数据呢？
关于Storm与JStorm的调度算法的讨论
Southan97: （该topology需要4个worker，1个spout（X），一个bolt（Y），spout/bolt各占2个线程) 这里应该是spout/bolt各占两个进程（worker）才对吧？如果是两个executor，直接放在一个worker里面不就好了嘛？
Storm Trident
zs808: 感谢分享！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。