C++ AMP分组优化原理，以矩阵乘法为例

最新推荐文章于 2022-09-17 18:00:14 发布

一只傻乎乎的猪

最新推荐文章于 2022-09-17 18:00:14 发布

阅读量416

点赞数 1

分类专栏： c++ 文章标签：算法 c++ 矩阵

本文链接：https://blog.csdn.net/Npe_xl_violet/article/details/117114631

版权

本文探讨了C++ AMP中用于提高效率的分组优化原理，通过矩阵乘法的例子来说明。传统的矩阵乘法存在重复读取同一行元素导致的I/O性能瓶颈，采用分组优化能有效减少这种重复操作。测试表明，选择16作为分组大小可以获得较好的优化效果。

摘要由CSDN通过智能技术生成

C++ AMP分组优化原理，以矩阵乘法为例

这是我们普通的AMP矩阵乘法:

#include<amp.h>

Concurrency::array_view<const float, 2> a(M, W, vA);
Concurrency::array_view<const float, 2> b(W, N, vB);
Concurrency::array_view<float, 2> c(M, N, vC);
	
c.discard_data();
Concurrency::parallel_for_each(
	c.extent,
	[=](Concurrency::index<2> idx) restrict(amp) {
   
		int row = idx[0]

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

一只傻乎乎的猪

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
C++ AMP分组优化原理，以矩阵乘法为例

C++ AMP分组优化原理，以矩阵乘法为例这是我们普通的AMP矩阵乘法:#include<amp.h>Concurrency::array_view<const float, 2> a(M, W, vA);Concurrency::array_view<const float, 2> b(W, N, vB);Concurrency::array_view<float, 2> c(M, N, vC); c.discard_data();Conc
复制链接

扫一扫