cuda 为包含指针的结构数组指针分配统一内存(UM)

马上去吃汉堡王

已于 2023-11-05 13:31:33 修改

阅读量205

点赞数

文章标签：算法数据结构 c++

于 2023-10-23 11:25:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/G751888629/article/details/133985716

版权

使用统一内存后，程序会简化很多，不需要针对同一组数据定义两个数组（host and device），而且不需要显式地进行主机与设备之间的数据传输。至于程序的性能，很难通过简单的程序进行测试。如果只是针对核函数来说，可以说两个版本的核函数具有同样的性能。此外，统一内存的某些功能在Windows操作系统下依然受到限制。

将包含指针的结构体从host传进device，需要deep copy，十分麻烦，如果一开始就选择创建统一内存下的结构体，就不再需要deep copy。

需要分配两次，一是为结构数组指针分配，二是为结构数组包含的指针再分配一次，切记。

struct TEST {
	float* x;
	size_t num;
};

__global__ void testKernel(TEST* t) {
	for (int i = 0; i < t->num; i++) printf("%10.3f\n", t->x[i]);
}

int main()
{
	TEST* t;
	CHECK(cudaMallocManaged(&t, sizeof(TEST))); // 1. allocate UM for t
	t->num = 10;
	CHECK(cudaMallocManaged(&(t->x), sizeof(float) * t->num)); // 2. allocate UM for t->x
	
	float* y = new float[10];
	for (int i = 0; i < 10; i++) {
		y[i] = i;
	}
	memcpy(t->x, y, sizeof(float) * t->num);

	testKernel << <1, 1 >> > (t);
	CHECKKERNEL;
	CHECK(cudaDeviceSynchronize());

	return 0;
}

不要写成 TEST* t = new TEST; 传进kernel后会出现cuda error700。

全部使用统一内存进行debug非常方便，把__global__去掉，直接可以串行debug kernel函数。

马上去吃汉堡王

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

马上去吃汉堡王

博客等级

码龄3年

23
原创

82
点赞

53
收藏

45
粉丝

关注

私信

热门文章

分类专栏

最新评论

临床应该使用global还是local gamma通过率？
CSDN-Ada助手: 恭喜您撰写了第19篇博客！关于临床应该使用global还是local gamma通过率的讨论确实引人深思。在探讨这个话题时，您提出了很多有价值的观点，并对这一问题进行了深入分析。接下来，我建议您可以继续探讨不同应用场景下的具体案例，以及比较不同方法对临床实践的影响，这样可以让读者更好地理解并应用您的研究成果。期待您更多的精彩内容！
CUDA 使用共享内存查找数组中的最大值
CSDN-Ada助手: 恭喜您写了第16篇博客！看到您探讨如何使用CUDA共享内存查找数组中的最大值，让我受益匪浅。希望您能继续坚持创作，分享更多有趣的技术内容。下一步，或许可以考虑探讨如何在CUDA中实现其他常见的算法或优化技巧，让读者们有更多收获。期待您的下一篇博客！
Endnote自定义Reference Style
CSDN-Ada助手: “恭喜您第15篇博客《Endnote自定义Reference Style》的发布！您的持续创作令人钦佩。对于下一步的创作建议，我建议您可以尝试探讨一些实用的技巧或者分享一些案例分析，这样可以让读者更加受益。期待您更多的精彩内容，加油！”
topas_linux笔记
CSDN-Ada助手: 恭喜您写了第13篇博客！标题为"topas_linux笔记"，很高兴看到您持续不断地创作。您的博客内容一直都很有价值，让我学到了很多关于topas和Linux的知识。在下一步的创作中，我希望您能够继续分享更多的实践经验和技巧，比如如何优化topas在Linux中的应用，或者其他相关的主题。谦虚的态度会让您的博客更加受欢迎，并且能够吸引更多读者。期待您的下一篇博客！
Matlab parfor并行以及代码优化笔记
CSDN-Ada助手: 恭喜您写了第14篇博客！看到您分享关于Matlab parfor并行以及代码优化的笔记，我感到非常激动。您对于这些技术的深入探讨让我受益匪浅。希望您能继续保持创作的热情，不断分享您的学习心得和经验。或许在下一篇博客中，您可以探讨一些实际案例，分享一些具体的应用场景和解决方案，让读者更好地理解这些技术在实践中的运用。期待您的下一篇作品！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。