【Hadoop】数据处理----MapReduce

最新推荐文章于 2023-06-04 00:46:34 发布

一支支穿云箭

最新推荐文章于 2023-06-04 00:46:34 发布

阅读量1.9k

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mengdonghui123456/article/details/53214467

版权

Mapreduce 是一种处理海量数据的并行编程模型和计算框架。在hadoop中负责进行数据的处理分析。

工作原理：

Mapreduce采用分治的算法，既处理的数据或任务需要满足一下两个条件：

1，数据集可以分解成多个小的数据集;

2，各个小数据集的结果汇集起来就是大数据集的结果。

在分治的思想下，mapreduce被抽象出两个可自定义的函数：map负责将数据集或任务进行割分；reduce负责将割分数据集的结果汇集起来。其中Mapreduce框架负责协调处理。

具体处理三过程：

Map过程：继承mapper类进行数据的割分；

Reduce过程：继承reduce类进行结果集的汇集；

最低0.47元/天解锁文章

一支支穿云箭

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
33
评论
【Hadoop】数据处理----MapReduce

Mapreduce Mapreduce 是一种处理海量数据的并行编程模型和计算框架。在hadoop中负责进行数据的处理分析。工作原理：Mapreduce采用分治的算法，既处理的数据或任务需要满足一下两个条件：1，数据集可以分解成多个小的数据集。2,各个小数据集的结果汇集起来就是大数据集的结果。在分治的思想下，mapreduce被抽象出两个可自定义的
复制链接

扫一扫

评论 33

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。