MapReduce详解-基础入门

本文详细介绍了MapReduce的定义、设计思路、特点以及核心编程思想。MapReduce是一个分布式运算框架,适用于大数据分析,其核心编程思想包括Map阶段和Reduce阶段的并发执行。编程规范涵盖Mapper、Reduce和Driver的实现细节,如Mapper的map()方法和Reduce的reduce()方法。MapReduce具备易于编程、可扩展性和高容错性的优点,但不适用于实时计算和流式计算。
摘要由CSDN通过智能技术生成

一、MapRduce定义

MapReduce是一个分布式运算程序的编程框架,是用户开发"基于Hadoop的数据分析应用"的核心框架

二、MapReduce的设计思路

1、分而治之:
简化并计算的编程模式,不需要考虑集群之间的数据交互,只需要注重我们的业务逻辑
2、构建抽象模型:Map和Reduce
3、开发人员专注于实现Mapper和Reduce

三、MapReduce特点

优点
1、易于编程
2、可扩展性
3、高容错性
4、高吞吐量:每秒钟处理的数据量
不适用领域
1、难以实时计算
2、不适合流式计算
3、不擅长DAG(有向图)计算

四、MapReduce核心编程思想

在这里插入图片描述
在这里插入图片描述
1、MapReduce运算程序一般分为两个阶段:Map阶段和Reduce阶段
2、Map阶段的并发MapTask,完全并行运行,互不相干
3、Reduce阶段的并发ReduceTask,完全互不相干,但是他们的数据依赖于上一

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值