通过矩阵乘法来搞懂MapReduce?

                               (一)

                   矩阵乘法来理解MapReduce

  1. 要求使用计算机计算矩阵相乘(两个矩阵大小超过计算机内存大小)

    2. 因为矩阵相乘是指行*列,故可以把第一个矩阵第一行记作A1和另一个矩阵的第一列记作B1,以下类推.....分别推送到一台服务器上去执行行列乘积,(这就对应于MapReduce中Map)如果这个矩阵的大小为100行*100列,那么我们就需要100台机器去并行执行每行每列的计算乘积。如下图:

    3 . 各个计算机全部处理完毕后会对各个机器计算的结果进行汇总,最后输出结果。(这就对应于MapReduce中Reduce)。

  (二)

  使用场景及分析

        从上面的计算过程来看MapReduce是采用了各个击破的套路,先把一个大的计算过程,分解成小的计算过程并计算出每个过程的计算结果,最后把各个计算结果合并起来就得到完整的计算结果。不仅可以解决单台机器配置问题,而且可以并行计算,加快计算速度。

        MapReduce在数据分析中起着非常重要作用,比如我们需要对用户访问某个URL进行分析,如果没有MapReduce的话我们需要不断串行读取,不断循环分析或者优化后采用多线程也会很复杂,但是有了MapReduce模型之后我们就可以把数据拆分开并行分析处理,最后汇总。特别适合数据量大,存在重复性高,汇总后结果比较小的使用场景。

 (三)
  总结

      由此可以看出MapReduce的道理是非常简单的,主要采用了分治的思想。他也非常符合日常生活常理,当我们做一件比较大的工作时,通常习惯性把一个大任务拆分成多个小任务,然后各个击破处理。

                                  

关注了解更多

  

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Spring_java_gg

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值