spark与tez比较

最新推荐文章于 2024-03-18 21:47:56 发布

Data & safety

最新推荐文章于 2024-03-18 21:47:56 发布

阅读量7.3k

点赞数 4

分类专栏： Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/w892824196/article/details/102465885

版权

Hadoop 专栏收录该内容

89 篇文章 2 订阅

订阅专栏

概述

spark号称比mr快100倍，而tez也号称比mr快100倍；二者性能都远程mr，为什么都能远超mr？使用场景有什么区别？两者各自的优势又是在哪里？本文主要探讨这些问题

为什么性能远超mr？

spark与tez都是以dag方式处理数据

使用场景区别？

spark更像是一个通用的计算引擎，提供内存计算，实时流处理，机器学习等多种计算方式，适合迭代计算
tez作为一个框架工具，特定为hive和pig提供批量计算

优势体现？

spark属于内存计算，支持多种运行模式，可以跑在standalone，yarn上；而tez只能跑在yarn上；虽然spark与yarn兼容，但是spark不适合和其他yarn应用跑在一起
tez能够及时的释放资源，重用container，节省调度时间，对内存的资源要求率不高；而spark如果存在迭代计算时，container一直占用资源；

总结

tez与spark两者并不矛盾，不存在冲突，在实际生产中，如果数据需要快速处理而且资源充足，则可以选择spark；如果资源是瓶颈，则可以使用tez；可以根据不同场景不同数据层次做出选择；这个总结同样也适合spark与mr的比较；

关注

4
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
spark与tez比较

概述spark号称比mr快100倍，而tez也号称比mr快100倍；二者性能都远程mr，为什么都能远超mr？使用场景有什么区别？两者各自的优势又是在哪里？本文主要探讨这些问题为什么性能远超mr？spark与tez都是以dag方式处理数据使用场景区别？spark更像是一个通用的计算引擎，提供内存计算，实时流处理，机器学习等多种计算方式，适合迭代计算 tez作为一个框架工具...
复制链接

扫一扫

专栏目录

Data & safety

CSDN认证博客专家 CSDN认证企业博客

码龄11年

689: 原创

2万+: 周排名

54万+: 总排名

285万+: 访问

: 等级

2万+: 积分

532: 粉丝

541: 获赞

136: 评论

2940: 收藏

私信

关注

热门文章

分类专栏

最新评论

MHA监控进程异常退出
水煮字节: 确实诡异，在命令行中用守护进程运行后退出会话进程就挂了，在脚本里就可以
当前读和快照读的区别
快乐学习的小黑蛋: 江苏南京史豪杰到此一游
Kafka学习理解-listeners配置
lyq495: 设置了三个地址 . broker之间通信使用INNER, 当producer来调用时 , 给172.120.0.1:9092这个地址 , 当consumer来调用时 , 给115.120.0.1:9092这个地址???这句话不懂，可否解释下，楼主？
win10打开文件夹速度慢怎么办
pedi: 牛皮，设置完重启后，打开文件夹快多了，笔记本风扇连P都不敢放一声了，原来基本什么也没开也容易一直高速地转，风力很大。看来笔记本渲染这些文件图标真挺吃CPU
ArcMap连接mysql数据库
qq_58327528: 能改写吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。