cuda 寄存器数组使用解析

最新推荐文章于 2024-06-17 15:59:28 发布

Fivestar_wang

最新推荐文章于 2024-06-17 15:59:28 发布

阅读量3.4k

点赞数 2

分类专栏： cuda 文章标签： cuda 寄存器数组使用解析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013507368/article/details/43370423

版权

cuda 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

关于cuda寄存器数组

在基于cuda对一些算法做并行优化时，为了尽可能的提高算法的运行速度，有时我们会想要用寄存器数组使得算法飞一般的快，然而，效果却总是差强人意。用了竟然比没用快，这是为什么呢？

哈哈，说重点，我们定义寄存器数组有以下两种方式：

1 Inta[8];

此时，我们定义的数组真的是我们想要的寄存器数组吗？这样的定义，编译器将我们定义的“寄存器数组”放在了 local memory，而local memory 就是在显存中开辟的一块空间，速度怎么可能会快？

2 int a[8] = {0,0,0,0,0,0,0,0};

定义时顺便初始化，此时是不是我们想要的寄存器数组呢？不一定，只能说有一定的概率是我们想要的寄存器数组。编译器会根据定义数组的大小确定是否将寄存器数组放入local memory。可是具体数组的size为多少会是我们想要的寄存器数组，不得而知！

那么，有没有方法强制使我们定义的寄存器数组保存在寄存器中呢？我表示，没查到。

好像只有定义多个变量。

例如：将 int a[8]; 替换为如下形式:

Int a0;

Int a1;

Int a2;

Int a3;

Int a4;

Int a5;

Int a6;

Int a7;

只是这样的定义方法，程序的通用性会再降一个级别

说了半天，好像净是废话，这样当然可以啦。好了，再强调一下，如果各位博友知道如何在cuda中如何定义我们想要的寄存器数组(不是将存储空间开辟在local memory中的寄存器数组)，请一定联系我，跪谢。

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Fivestar_wang CSDN认证博客专家 CSDN认证企业博客

码龄11年

39: 原创

18万+: 周排名

48万+: 总排名

25万+: 访问

: 等级

2481: 积分

67: 粉丝

127: 获赞

53: 评论

558: 收藏

私信

关注

热门文章

分类专栏

云计算 2篇
python 2篇
C/C++ 16篇
多线程 4篇
算法 7篇
Win32编程 4篇
汇编 9篇
cuda 1篇
其他

最新评论

汇编--计算机钢琴实现
muggle922: 博主大大，为什么代码在电脑上可以实现出来，但是运行时不发声
汇编-排序实验
BlackSheep2333: 确实，原代码运行没有输出结果，按热评老哥说的在子程序尾加上子程序名+endp就有输出结果了
C++读取excel表格
听风有信丶: 运行起来，说excel不能访问该工程文件，文档可能加密或只读。请问这个怎么解决啊
QR分解求矩阵特征值、特征向量 C语言
Dreamgreater: 你好，请问这个算法求解稀疏矩阵的特征值的能力怎么样
QR分解求矩阵特征值、特征向量 C语言
qq_41556800: 是可以出结果的，我一直试到 16 x 16，都没问题

大家在看

10个降低性能的SQL问题及改进措施

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。