TEZ和MapReduce区别

最新推荐文章于 2023-08-05 22:28:28 发布

蓝之刃

最新推荐文章于 2023-08-05 22:28:28 发布

阅读量3.7k

点赞数 2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_16320025/article/details/103071708

版权

Tez产生背景与定位在开源界，当前最广泛使用的计算模型是MapReduce，该模型将计算过程抽象成Map和Reduce两个阶段，并通过shuffle机制将两个阶段连接起来。但在一些应用场景中，为了套用MapReduce模型解决问题，不得不将问题分解成若干个有依赖关系的子问题，每个子问题对应一个MapReduce作业，最终所有这些作业形成一个有向图（DAG，Directed Acyclic G...

摘要由CSDN通过智能技术生成

Tez产生背景与定位

在开源界，当前最广泛使用的计算模型是MapReduce，该模型将计算过程抽象成Map和Reduce两个阶段，并通过shuffle机制将两个阶段连接起来。但在一些应用场景中，为了套用MapReduce模型解决问题，不得不将问题分解成若干个有依赖关系的子问题，每个子问题对应一个MapReduce作业，最终所有这些作业形成一个有向图（DAG，Directed Acyclic Graph），在该DAG中，由于每个节点是一个MapReduce作业，因此它们均会从HDFS上读一次数据和写一次数据（默认写三份），即使中间节点产生的数据仅是临时数据。很显然，这种表达依赖关系作业的方式是低效的，会产生大量不必要的磁盘和网络IO。

为了更高效地运行存在依赖关系的作业（比如Pig和Hive产生的MapReduce作业），减少磁盘和网络IO，Hortonworks开发并开源了DAG计算框架Tez[1]。

在实际大数据处理场景中，很多问题需转化成DAG模型解决，典型的有两类，分别是：

用户编写的应用程序：很多场景下，用户编写的多个MapReduce应用程序之间存在依赖关系或者为了使用MapReduce解决一个问题，不得不将问题转化成一系列存在依赖关系的MapReduce作业，而为了表达这些作业的依赖关系，用户通常借助于像Oozie

最低0.47元/天解锁文章

关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
TEZ和MapReduce区别

Tez产生背景与定位在开源界，当前最广泛使用的计算模型是MapReduce，该模型将计算过程抽象成Map和Reduce两个阶段，并通过shuffle机制将两个阶段连接起来。但在一些应用场景中，为了套用MapReduce模型解决问题，不得不将问题分解成若干个有依赖关系的子问题，每个子问题对应一个MapReduce作业，最终所有这些作业形成一个有向图（DAG，Directed Acyclic G...
复制链接

扫一扫

蓝之刃 CSDN认证博客专家 CSDN认证企业博客

码龄10年

136: 原创

23万+: 周排名

125万+: 总排名

36万+: 访问

: 等级

4182: 积分

51: 粉丝

142: 获赞

43: 评论

592: 收藏

私信

关注

热门文章

分类专栏

笔记 5篇

最新评论

hive hsq中的group by & Distribute by & partition by & cluster by & partitioned by & clustered by
卡特.卡尔文: 是hql不是hsq
seata 的注册中心和配置中心
weixin_38453233: 文件的方式作为注册中心还是有用的，如果项目和seata部署在k8s中，可以利用其Pod健康检查和Service负载均衡的特性，使用文件模式直接进行直连配置即可
MapperScan添加动态扫描(占位符)功能
光脚踩地雷: 重写之后，没有生效。似乎是没有切面处理我写的MapperScan，该怎么处理呢。
shuffle原理和内存溢出原因
yo8237233: 第一个方案如果请求的内存超出内存限制是有问题的
参考CAS流程并利用JWT的key共享实现单点登陆
betaberry: 要不就把浏览器和客户端之间的cookie给取消了吧。。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。