DAG vs. MPP

最新推荐文章于 2022-06-25 13:46:20 发布

张包峰

最新推荐文章于 2022-06-25 13:46:20 发布

阅读量1w

点赞数

分类专栏： DAG MPP 分布式系统文章标签： DAG MPP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pelick/article/details/51538080

版权

本文探讨了DAG和MPP两种架构在Native Design、Task Schedule、OLAP Speed、Shared Storage以及Core Aspects等方面的区别。MPP以其优秀的Compiler和Optimizer、对称的Segment设计展现了在OLAP速度上的优势，而DAG则以共享存储和灵活的Task调度展现出易用性和灵活性。现代系统往往采用两者的混合实现，以实现更好的性能和功能。

摘要由CSDN通过智能技术生成

DAG vs. MPP

Native Design

MPP每个Segment高度对称(symmetric)，狭义MPP storage各个Segment自己管理，自己备份，涉及某数据相关的query必定会落到某个Segment上，有concurrency和straggler的问题存在。

MPP天然有很优秀的Compiler和Optimizer，包括local runtime环境是数据库，解析、优化、codegen、执行一气呵成。Segment内有良好的二级资源管理和Task调度，足够细粒度且对query敏感(query隔离、内存使用监控等)。

DAG天然share storage，master能感知全局meta，所以才能单点schedule好task sets，并协调Executor之间的上下游数据shuffle、任务起停等过程。DAG每个task从设计上有简单、幂等等性质，可做task speculation的工作，甚至动态替换某个Node、更新其并发度。

DAG容易对不同存储介质的数据做IO，目前场景的是在输入和输出节点，理论上各个计算节点可挂载不同存储执行引擎，只要meta共享。

Task Schedule

MPP竖切，直通通完成Task的构造，每个Segment收到的是较为完整的sub-query。

DAG横切，节点合并(包括Spark的窄依赖和Stage)是优化手段，理论上不同Node的tasks要分散到不同计算进程上。最优的条件下，如Spark 2.0 whole-stage-codegen，是理论上把SQL优化到MPP那样的极致。

OLAP Speed

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

张包峰 CSDN认证博客专家 CSDN认证企业博客

码龄13年

158: 原创

6万+: 周排名

227万+: 总排名

109万+: 访问

: 等级

1万+: 积分

873: 粉丝

353: 获赞

234: 评论

143: 收藏

私信

关注

热门文章

分类专栏

最新评论

GraphX 实现K-Core
满眼醉意: 你好请问你那些参数是什么意思 val kNum = 200 var lastVerticeNum: Long = degreeGraph.numVertices var thisVerticeNum: Long = -1 var isConverged = false val maxIter = 10 var i = 1
DRF算法
雪落潇寒: 哥打错字了，用户B的每个任务都请求（3CPU，1GB）。
DRF算法
baimeicomehere: Consider a system with of 9 CPUs, 18 GB RAM, and two users, where user A runs tasks with demand vector h1 CPU, 4 GBi, and user B runs tasks with demand vector h3 CPUs, 1 GBi each. 考虑一个有9个cpu和18GB的系统，有两个用户：用户A的每个任务都请求（1CPU，4GB）资源；用户B的每个任务都请求（3CPU，4GB）资源翻译对别－－”“
GraphX 图数据建模和存储
野老杂谈: 说的啥
pyspark原理简介
beijishiqidu: 兄弟，这篇文章我转走了哈，我会注明出处的，如果不行的话，可以告诉我，我立马删除，多谢。我的网站http://www.beijishiqidu.com/

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。