Hive的底层计算框架默认是MapReduce，还有两种是Tez和Spark这几种的区别是什么？计算速度上为什么会有明显的差异？

最新推荐文章于 2023-12-20 11:39:47 发布

Monmently

最新推荐文章于 2023-12-20 11:39:47 发布

阅读量1.2k

点赞数

分类专栏： spark 文章标签：大数据 spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37748919/article/details/107465317

版权

spark 专栏收录该内容

0 篇文章 0 订阅

订阅专栏

mapreduce:
基于磁盘的迭代,中间结果保存在文件中
spark:
基于内存的,中间结果无需落地磁盘，减少了磁盘IO的操作,DAG计算模型-可以减少shuffle次数

spark	mr
spark遇到宽依赖才会发生shuffle	一次mr任务就会发生一次
spark在map端会完成排序	mr在reduce端会进行归并排序
spark先放内存	mr直接放磁盘

tez:
也有dag有向无关图，container重用，但部署繁琐

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Hive的底层计算框架默认是MapReduce，还有两种是Tez和Spark这几种的区别是什么？计算速度上为什么会有明显的差异？

mapreduce:基于磁盘的迭代,中间结果保存在文件中spark:基于内存的,中间结果无需落地磁盘，减少了磁盘IO的操作,DAG计算模型-可以减少shuffle次数sparkmrspark遇到宽依赖才会发生shuffle一次mr任务就会发生一次spark在map端会完成排序mr在reduce端会进行归并排序spark先放内存mr直接放磁盘tez:也有dag有向无关图，container重用，但部署繁琐...
复制链接

扫一扫

专栏目录

Monmently CSDN认证博客专家 CSDN认证企业博客

码龄7年

18: 原创

82万+: 周排名

91万+: 总排名

2万+: 访问

: 等级

339: 积分

1: 粉丝

16: 获赞

5: 评论

46: 收藏

私信

关注

热门文章

分类专栏

oracle 1篇
python 3篇
股票知识 8篇
spark
hive 3篇

最新评论

基金api接口实时数据
物联学长: 这个会延迟三分钟
基金api接口实时数据
我是李大福: 这个不错啊顺便发一下微信版的地址供同行研究 [code=html] <a href="https://adain.top/fund2/index.html">https://adain.top/fund2/index.html</a> [/code]
基金api接口实时数据
勇敢的小提莫: 不错，设置一下utf-8就可以获取正常的中文了
基金api接口实时数据
醉染: 老哥这个是从哪里搞到的？有没有java的api？
hive 每周第一天最后一天每月第一天最后一天
mcq12322: 每月最后一天 last_day(CURRENT_DATE) select last_day(DATE_SUB('2019-01-01', 1)) 结果为 2018-12-31

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。