大数据学习笔记12:理解MapReduce

理解MapReduce

 

1、MapReduce  时两个过程

      map:匹配 或者 叫映射

     reduce : 汇总

 

2、MapReduce 体现了分而治之的思想

 

3、MapReduce 是移动计算  而非移动数据

 

4、统计单词出现个数的例子

     一本书1000页。---假定单页印刷

    我们找来 1010人,其中一千人 一人一页来分别统计本页的单词出现情况。

    另外10人 来汇总 那1000人的 统计结果。

   其中的 1000人做的 就是 Map ,把大任务划分成多个小块,分别计算。

   另外10执行的就是 reduce,汇总计算。-- reduce 英文本意就是 减少 、缩小的 意思。

 

5、数钱的例子

     桌子上一大堆钱,有面值 100、50 、10 块的。

     map:桌子做一圈 10个人 ,每人分一堆钱,整理钱--把100的放一摞、50一摞、10块一摞

     reduce:最后三个人 收汇总的钱 ,一个人管100的  一个人管50的 一个管10块的。

                    三个人分别计算自己钱数,最后就得到总钱数。

 

 

 

6、MapReduce 处理的目标:海量数据

 

 

7、 MapReduce 是一个分布式 计算框架。

 

 

8、MapReduce 框架 解决了那些问题:

     

     8.1   数据分布式存储---使用HDFS

     8.2   作业调度

     8.3   容错处理

     8.4    机器见通讯的复杂处理

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值