- 博客(1)
- 收藏
- 关注
原创 cuda卷积代码学习
1.第一步:先定义后续用到的各种参数,有mask的长宽,图像的长宽,图像通道数,host的输入输出数据,device的输入输出数据,device下的mask。使用cudaMemcpy可以将host的数据传递到device上,也可以将device的代码传递到host上。该代码是基于shared_memory写的,这种内存方式使得程序的性能大幅度提升。该代码是基于PPM的数据,因此需要使用PPM_import函数进行解析。1)第一批load数据。// 第destY行。// 第destX行。
2023-04-24 15:47:29 177 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人