CUDA学习笔记（二）

最新推荐文章于 2024-06-07 09:44:56 发布

crasyter

最新推荐文章于 2024-06-07 09:44:56 发布

阅读量544

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41169280/article/details/107472230

版权

1、cudaSetDevice(i);调用第i个显卡的上下文
线程安全
2、分配内存h_Kernel = (float *)malloc(KERNEL_W * sizeof(float));
CUDA运行库提供了函数以分配/释放设备端的内存，以及与主机端内存传输数据。设备内存指的是全局内存+常量内存+纹理内存。

线性内存是常用的内存方式，在GPU上用40位的地址线寻址。线性内存可以用cudaMalloc()分配，用cudaFree()释放，用cudaMemcpy()复制数据，用cudaMemset()赋值。

对于2D或3D数组，可以使用cudaMallocPitch()和cudaMalloc3D()来分配内存。这两个函数会自动padding，以满足内存对齐的要求，提高内存读写效率。

另外，如果要在设备内存中定义全局变量，则需要使用使用__constant__或__device__来修饰，并使用cudaMemcpyToSymbol()和cudaMemcpyFromSymbol()来读写。

3、device constant float d_Kernel[KERNEL_W];
定义全局变量d_Kernel为KERNEL_W，5

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
CUDA学习笔记（二）

1、cudaSetDevice(i);调用第i个显卡的上下文线程安全2、分配内存h_Kernel = (float *)malloc(KERNEL_W * sizeof(float));CUDA运行库提供了函数以分配/释放设备端的内存，以及与主机端内存传输数据。设备内存指的是全局内存+常量内存+纹理内存。线性内存是常用的内存方式，在GPU上用40位的地址线寻址。线性内存可以用cudaMalloc()分配，用cudaFree()释放，用cudaMemcpy()复制数据，用cudaMemset()赋值。
复制链接

扫一扫

crasyter CSDN认证博客专家 CSDN认证企业博客

码龄7年

114: 原创

3万+: 周排名

93万+: 总排名

21万+: 访问

: 等级

1535: 积分

4839: 粉丝

123: 获赞

67: 评论

662: 收藏

私信

关注

热门文章

分类专栏

最新评论

安装库报错：No CUDA runtime is found, using CUDA_HOME=‘/usr/local/cuda-11.3‘
weixin_51528442: ".yml文件中只有指定cuda版本，而没有自动安装正确的torch版本" 不是我说, 咱们这个文字能不能按照人类能够理解的方式叙述呢? .yml文件怎么会安装torch版本呢?
运行msckf_vio
能人不少说话: 博主，求tum和kitti的launch文件和yaml文件，救救命啊
运行msckf_vio
New Boy: 您好，launch文件和yaml文件怎么编写
运行msckf_vio
New Boy: 您好，请问怎么运行自己的数据集
运行msckf_vio
47483735: 您好，请问您解决这个问题了吗？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。