MapReduce设计模式

最新推荐文章于 2021-12-14 16:58:29 发布

架构师小秘圈

最新推荐文章于 2021-12-14 16:58:29 发布

阅读量502

点赞数

本文讨论了四种主要的MapReduce设计模式：

1. Input-Map-Reduce-Output
2. Input-Map-Output
3. Input-Multiple Maps-Reduce-Output

4. Input-Map-Combiner-Reduce-Output

下面是一些真实的场景，帮助您了解何时使用哪个设计模式。

Input-Map-Reduce-Output

640?wx_fmt=png

如果要执行聚合操作，则使用此模式：

640?wx_fmt=png

640?wx_fmt=png

统计工资总额，我们需要确定关键性别和价值薪酬。Map函数的输出为：

640?wx_fmt=png

中间拆分为Reduce函数提供输入：

640?wx_fmt=png

减少Reduce函数输出为：

640?wx_fmt=png

Input-Map-Output

640?wx_fmt=png

Reduce函数主要用于聚集和计算。但是，如果我们只想更改数据的格式，则使用Input-Map-Output模式：

640?wx_fmt=png

Input-Multiple Maps-Reduce-Output

640?wx_fmt=png

在Input-Multiple Maps-Reduce-Output设计模式中，我们的输入来自两个文件，每个文件都有不同的模式。（请注意，如果两个或多个文件具有相同的模式，则不需要两个映射器。我们可以在一个映射器类中编写相同的逻辑并提供多个输入文件。）

640?wx_fmt=png

此模式也用于Reduce-Side Join：

640?wx_fmt=png

Input-Map-Combiner-Reduce-Output

640?wx_fmt=png

Apache Spark对大型和小型数据处理任务是非常有效的，因为它最好地放大了执行有效分析所需的现有工具。与其他众所周知的大数据处理引擎相比，凭借其高度可扩展性以及令人难以置信的性能，Spark最终可能会让软件吞噬整个世界。

Combiner也称为half-reducer，是一个可选类，它通过接受Map类的输入然后将输出键值对传递给Reducer类来操作。Combiner功能的目的是减少Reducer的工作量。

在MapReduce程序中，20％的工作是在Map阶段完成的，这也称为数据准备阶段。这个阶段确实可以并行工作。

80％的工作是在Reduce阶段完成的，这被称为计算阶段。这项工作不是并行完成的，因此它比Map阶段慢。为了减少计算时间，Reduce阶段的一些工作可以在Combiner阶段完成。

实例

有很多部门，我们必须先按部门计算工资总额，然后按性别计算。但是，计算这些总数还有其他规则。按性别计算每个部门的总数后：

如果部门工资总额大于20万，则在总额中加25万。

如果部门工资总额大于10万，则在总额中加10万。

640?wx_fmt=png

希望我的文章对你有所启发，有什么更好的想法，欢迎留言！

640?wx_fmt=jpeg

长按二维码 ▲

订阅「架构师小秘圈」公众号

如有启发，帮我点个在看，谢谢↓

架构师小秘圈

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
MapReduce设计模式

本文讨论了四种主要的MapReduce设计模式：1. Input-Map-Reduce-Output2. Input-Map-Output3. Input-Multipl...
复制链接

扫一扫

架构师小秘圈 CSDN认证博客专家 CSDN认证企业博客

码龄7年

453: 原创

-: 周排名

1万+: 总排名

461万+: 访问

-: 等级

0: 积分

2146: 粉丝

1826: 获赞

740: 评论

6467: 收藏

私信

关注

热门文章

最新评论

惊呆了！Spring Boot 还能远程调试？
要钱的大哥: 这个address和配置中的port有什么区别
字节终面：CPU 是如何读写内存的？
XF_09: cache不是在内存和磁盘之间吗，为什么先查cache再查内存
王者荣耀背后的实时大数据平台用了什么黑科技？
「已注销」: 真厉害好详细问一下作者想要实现王者荣耀对局的实时评分能做出来吗
避雷快手！确认面试通过，提交银行流水和个人信息后，被告知其他人接了offer！...
2401_84730596: 是这样，收集了流水，两周了，也不谈薪，问就是流程中，还要问其它offer情况，我想说，你们公司四轮技术面是啥也没结论吗，还要看其他公司的offer给钱，自己觉得自己面试水平低吗，感觉有点渣男行为
一份两年前一个月的工作经历没写在简历上，背调前主动坦白，却被背调公司亮了红灯，到手的offer没了！...
2401_84488984: 全景求是管理顾问公司就是干这个的。我老公三年前有一家工作20多天的公司简历没写，进行私密信息调查时，我老公跟它们说漏了一个月如果你们觉得有问题我就不把工资账单、社保记录、缴税信息还有前两家公司的领导信息发给你们了。他们说没事你发吧，offer 也发了。最后还是因为这不到一个月的入职信息li q n红灯。

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。