矩阵乘法的Mapreduce实现过程

最新推荐文章于 2020-03-23 20:57:18 发布

卅一

最新推荐文章于 2020-03-23 20:57:18 发布

阅读量2.2k

点赞数 4

分类专栏：数据挖掘应用开发文章标签：经验算法 mapreduce 矩阵乘法

本文链接：https://blog.csdn.net/yxb3158/article/details/45083871

版权

本文介绍了如何使用MapReduce框架实现矩阵乘法。通过设计合理的key值，将矩阵元素映射并归约，实现并行计算。Map阶段将矩阵元素转化为<k, v>对，Reduce阶段依据标志位进行乘法运算并求和，完成矩阵乘法的过程。" 127744745,16287875,C语言运算与局部变量解析,"['C语言', '程序设计', '内存管理', '函数', '数据类型']

摘要由CSDN通过智能技术生成

MapReduce实现矩阵的乘法

在学习pageRank算法时看到这么一个小小的编程应用。并且一直自诩只要有原理就能写出代码（只是时间问题），矩阵乘法的原理很简单，基本上理工科生（只要学过线性代数或者相关课程）都知道。但是从来没有想过通过并行计算的方式来完成矩阵乘法。

这里矩阵的知识就不啰嗦了，矩阵的乘积记作为P=M*N。则P中的元素

简单粗暴的讲，就是左矩阵M的行依次与右矩阵的列元素对应相乘，然后再相加。

可能说到mapreduce算法可能都会想到map用来整理数据（这里指的就是矩阵中的元素），然后送至reduce中计算。说起来是挺简单的，但是从无到有的过程还是不容易的。关键是key值的设计，可以说一个key的设计是编程成功的一半。

下面详细的道来设计过程。

相信大家都关注到了<k，v>对里面的M: 和N:字样。这个得郑重声明一下，其实不用也可以，但是value值这样设置后很容易维护和调试代码（具体的可以参看以下陆嘉恒的《hadoop实战》关于单表关联的章节），因为能清晰看出元素的出处。必须要说明的是M:和N：后面的数字特别重要，M：y的y表示元素对应的列号；N：x的x表示元素对应的行号。这样说明之后是不是思路就清晰了，把这样的<k,v>上传给reduce，reduce收到的是〈k, list(v)〉，源代码的System.out.print("tuple==" + MN[0] + ":" + MN[1] +"\t");就能看得明白map的内容。List(v)就是如下的样子。