MapReduce基本概述——分布式计算框架

最新推荐文章于 2024-07-15 17:39:15 发布

雷神乐乐

最新推荐文章于 2024-07-15 17:39:15 发布

阅读量487

点赞数

分类专栏： # Hadoop 文章标签： mapreduce 服务器 hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Helen_1997_1997/article/details/128896841

版权

Hadoop 专栏收录该内容

12 篇文章 3 订阅

订阅专栏

目录

一、MapReduce的基本概念

二、MapReduce的设计思想

三、MapReduce特点

四、MapReduce编程规范

一、MapReduce的基本概念

MapReduce是一个分布式计算框架，它将大型数据操作作业分解为可以跨服务器集群并行执行的单个任务，起源于Google。适用于大规模数据处理场景，每个节点处理存储在该节点的数据，每个job包含Reduce两部分。

二、MapReduce的设计思想

分而治之——简化并行计算的编程模型
构建抽象模型：Map和Reduce——开发人员专注于实现Mapper和Reduce函数
隐藏系统层细节——开发人员专注于业务逻辑实现

三、MapReduce特点

优点：易于编程、可扩展性、高容错性、高吞吐量

不适用领域：难以实时计算、不适合流式计算、不适合DGA(有向图)计算

四、MapReduce编程规范

MapReduce框架处理的数据格式是<K,V>键值对形式

Mapper

Map端接收<K,V>键值对数据，经过处理输出新的<K,V>键值对
Map端处理逻辑写在Mapper类中map()方法中

Reducer

Reduce端搜集多个Mapper端输出的<K,V>数据，进行汇总
Reduce的业务逻辑写在reduce()方法中
每一组相同k的<k,itertator<v>>组调用一次reduce()方法

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MapReduce基本概述——分布式计算框架

MapReduce基本概述——分布式计算框架
复制链接

扫一扫

专栏目录

雷神乐乐 CSDN认证博客专家 CSDN认证企业博客

码龄2年

165: 原创

2073: 周排名

3万+: 总排名

23万+: 访问

: 等级

1982: 积分

1万+: 粉丝

267: 获赞

31: 评论

1091: 收藏

私信

关注

热门文章

分类专栏

最新评论

SQL经典50题
小吴今天早睡了吗: 另外给好兄弟提个建议，感觉你这套题后面比前面简单，练习起来有点奇怪，从练习的角度应该把题的顺序改一改，由简单到难好一点
SQL经典50题
小吴今天早睡了吗: 好像确实，但是就这道题好像又是对的，因为只有三个老师，教三科，不知道答案到底是啥了，不会写
SQL经典50题
weixin_54801722: 第17题可以简化一下 select student.SID,student.Sname, avg(IFNULL(score,0)) as 平均分, SUM(CASE WHEN CID='01' THEN score else 0 END) as 语文, SUM(CASE CID WHEN '02' THEN score else 0 END) as 数学, SUM(CASE CID WHEN '03' THEN score else 0 END) as 英语 from student LEFT JOIN sc on student.SID=sc.SID GROUP BY student.SID,student.Sname
SQL经典50题
weixin_54801722: 第十六题也有问题，没有查出来考试了但是没有考01科目的学生
SQL经典50题
weixin_54801722: 答案也不对啊，查出来的只是数量相同，不能保证科目也相同

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。