【高性能并行计算】——第三课　矩阵乘并行ｃａｎｎｏｎ算法

最新推荐文章于 2022-03-02 19:55:21 发布

weixin_30758821

最新推荐文章于 2022-03-02 19:55:21 发布

阅读量759

点赞数

原文链接：http://www.cnblogs.com/chihaoyuIsnotHere/p/10553617.html

版权

本文探讨了矩阵乘法的并行计算，包括基本并行实现的原理和Cannon算法。Cannon算法旨在减少传统分块矩阵乘法的存储需求，通过矩阵位移实现计算效率的提升。

摘要由CSDN通过智能技术生成

基本并行实现的讨论：

正如前面所讲的，矩阵相乘过程中，结果矩阵C中的每个元素都是可以独立计算的，即彼此之间并无依赖性。所以如果采用更多的处理器，将会显著地提高矩阵相乘的计算效率。

对于大小为n × n 的矩阵，加入我们有n个处理器，那么结果矩阵中的每一行，都可以用一个处理器来负责计算。此时，总共的并行计算步数为 O(n^2)。你可以理解为在串行实现的代码中，最外层的循环 for(i=0;i<n;i++) 被分别由n个处理器来并行的执行，而每个处理需要完成的任务仅仅是内部的两层循环。

如果采用n^2个处理器，那么就相当于结果矩阵中的每个元素都由一个处理器来负责计算。此时

最低0.47元/天解锁文章

weixin_30758821

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
【高性能并行计算】——第三课　矩阵乘并行ｃａｎｎｏｎ算法

基本并行实现的讨论：正如前面所讲的，矩阵相乘过程中，结果矩阵C中的每个元素都是可以独立计算的，即彼此之间并无依赖性。所以如果采用更多的处理器，将会显著地提高矩阵相乘的计算效率。对于大小为n × n 的矩阵，加入我们有n个处理器，那么结果矩阵中的每一行，都可以用一个处理器来负责计算。此时，总共的并行计算步数为 O(n^2)。你可以理解为在串行实现的代码中，最外层的...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。