hadoop之MapReduse_02

最新推荐文章于 2024-04-07 14:31:55 发布

WSX_ton

最新推荐文章于 2024-04-07 14:31:55 发布

阅读量253

点赞数

分类专栏： MapReduce hadoop 文章标签：大数据 MapReduce 基础知识

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/WSX_ton/article/details/103130089

版权

MapReduse（分布式计算框架）

一、MapReduce 并行计算
二、Hadoop -MapReduce设计构思
三、MapReduce 编程
- - 基础pom文件配置(idea开发)

一、MapReduce 并行计算

HDFS存储数据时对大于128M的数据会进行数据切分，每128M一个数据块，数据块会分散、分布存储到HDFS。

MapReduce在进行计算前会复制计算程序，每个数据块会分配一个独立的计算程序副本（MapTack）。计算时多个数据块几乎同时被读取并计算，但是计算程序完全相同。最终将各个计算程序计算的结果进行汇总（Reduce来汇总）
Alt

二、Hadoop -MapReduce设计构思

MapReduce是一个分布式运算程序的编程框架，核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序，并发运行在Hadoop集群上。
既然是做计算的框架，那么表现形式就是有个输入（input），MapReduce操作这个输入（input），通过本身定义好的计算模型，得到一个输出（output）。
Hadoop MapReduce构思体现在如下的三个方面：

如何应对大数据处理：分而治之
对相互间不具有计算依赖关系的大数据，实现并行最自然的办法就是采取分而治之的策略。并行计算的第一

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop之MapReduse_02

MapReduse（分布式计算框架）一、MapReduce 并行计算二、Hadoop -MapReduce设计构思三、MapReduce 编程基础pom文件配置(idea开发)一、MapReduce 并行计算HDFS存储数据时对大于128M的数据会进行数据切分，每128M一个数据块，数据块会分散、分布存储到HDFS。MapReduce在进行计算前会复制计算程序，每个数据块会分配一个独立的计算...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。