Spark上矩阵运算库（一）—— 矩阵相乘

最新推荐文章于 2023-10-07 00:12:51 发布

Fluid开源社区

最新推荐文章于 2023-10-07 00:12:51 发布

阅读量8k

点赞数

分类专栏：开源夏令营

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014252240/article/details/37740823

版权

基于Spark的矩阵相乘

项目中我将先实现基于Spark的矩阵相乘功能。并行化思路将参照MapReduce下的实现方案并做一些优化修改。经过查阅文献，选取比较可行的MapReduce参考方案是HAMA项目。该项目是Apache基金会下的一个顶级开源项目，属于Hadoop生态圈中的一个重要项目。根据HAMA项目主页上的简介，HAMA项目的目的是提供“a general BSP framework on top of Hadoop”。因此HAMA项目的目标现在主要围绕着BSP框架展开。

但是HAMA项目在早期的目标远比此要宏大，其目的有些类似于Spark项目中的MLLib，只是其底层是基于Hadoop生态圈的。下面这张图是截取自2010年发表在IEEE CouldCom会议上的介绍HAMA的文章[1]中的图。在这篇论文中，作者着重介绍了HAMA是如何利用MapReduce框架实现矩阵乘法的。因为MapReduce是第一个在大规模集群上运行的不同于MPI的并行计算框架，对于基于RDD模型的Spark实现具有很强的参考价值，因此我们决定先参考HAMA的实现方式在Spark上试验性的尝试矩阵乘法算法的实现，然后观测一下性能和瓶颈等。

最低0.47元/天解锁文章

Fluid开源社区

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Spark上矩阵运算库（一）—— 矩阵相乘

从HAMA 0.1版的"黑历史"开始 HAMA是Apache基金会下的一个顶级开源项目，属于Hadoop生态圈中的一个重要项目。根据HAMA项目主页上的简介，HAMA项目的目的是提供“a general BSP framework on top of Hadoop”。因此HAMA项目的目标现在主要围绕着BSP框架展开。但是HAMA项目在早期的目标远比此要宏大，其目的有些类似于Spark项目中
复制链接

扫一扫

专栏目录

Fluid开源社区 CSDN认证博客专家 CSDN认证企业博客

码龄10年

15: 原创

-: 周排名

216万+: 总排名

5万+: 访问

: 等级

774: 积分

94: 粉丝

25: 获赞

16: 评论

4: 收藏

私信

关注

热门文章

分类专栏

最新评论

Tachyon简介
溺水的鱼回复 chiyiw: 相同的思想不同的实现
Spark上矩阵运算库(七)--LU矩阵分解实现和Spark 1.1的SVD剖析
Czy_NARI 回复 Tom-Studio: 同问，多10k*10k以上的矩阵，如何求前d个最小的特征值对应的特征向量
Tachyon简介
chiyiw: 从Master/Worker到Editlog/Image再到心跳机制，这不就是HDFS那一套吗？
Spark上矩阵运算库（四）基本API搭建完毕
jelek: 博主您好，最近在接触spark矩阵运算相关的问题，找了一些相关的说明，但是对于比较大的矩阵，貌似没找到比较好的解决思路。想问一下您所列举的multiply(B: IndexMatrix, blkNum: Int)大概的处理思路是，哪里可以获取该方法？非常感谢！
Spark上矩阵运算库(七)--LU矩阵分解实现和Spark 1.1的SVD剖析
Tom-Studio: 您好，我看了您的博客收益匪浅真心，向您请教一下，我这有一个矩阵A，如何求A的特征向量

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。