CUDA
文章平均质量分 91
曙光_deeplove
安徽霍邱人,长期从事遥感影像变化检测、机器学习、深度学习在图像分类、目标检测方面的应用工作
展开
-
CUDA学习之原子操作
cuda学习转载 2022-07-09 22:41:40 · 1945 阅读 · 0 评论 -
CUDA编程之我的第一份代码
参考:我的第一份CUDA代码一、前言这是一份简单的CUDA编程入门,主要参考英伟达的官方文档进行学习,本人也是刚开始学习,如有表述错误,还请指出。官方文档链接如下:https://developer.nvidia.com/blog/even-easier-introduction-cuda/本文先从一份简单的C++代码开始,然后逐步介绍如何将C++代码转换为CUDA代码,以及对转换前后程序的运行时间进行对比,本文代码放在我的github中,有需要可以自取。https://gith原创 2022-06-09 15:22:25 · 311 阅读 · 0 评论 -
CUDA编程中的gridDim and blockDim
CUDA编程中的gridDim and blockDim原创 2022-06-09 01:23:10 · 2594 阅读 · 0 评论 -
并行执行与并发执行
一、前言我们在另一篇博客中介绍了cuda核函数的并行机制,其中就提到:一个warp中的32个线程是并行执行的。一个block中不同warp是并发执行的。比如说一个block中分成10个warps,warp0执行了两步,这时可能会切换warp1去执行两步。再切换回warp0执行两步。也就是一个block中的warp不能并行执行。而是并发执行。那本文就学习记录一下什么是并行,什么是并发,这样有助于我们理解cuda核函数的线程执行机制。二、...原创 2022-05-31 10:47:06 · 1526 阅读 · 0 评论 -
windows下使用nvcc和nvprof
nvcc这个大家都很熟悉了,是cuda代码的编译器。nvprof这个是cuda代码的性能分析工具,具体我不详细介绍了,感兴趣的可以自己搜索!我这里只介绍怎么去使用nvcc和nvprof这两个工具只要下载安装了cuda就可以出现了,默认情况下在如下路径中可以找到:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\bin我们的命令(参考链接:我的第一份CUDA代码)如下:那么我们从上面发现我们在windows10原创 2022-05-18 01:17:18 · 5015 阅读 · 8 评论 -
vs2019中使用nsys
(1)首先是先安装vs2019,这个我不再赘述要牢记不要轻易删除掉vs相关的缓存:不然想卸载都卸载不掉,会报以下错误:“找不到与以下参数匹配的安装产品”(2)安装cuda显卡驱动、cuda和cudnn安装cuda的时候要选择自定义,把nvidia compute、systems相关的都要勾选上!然后一路默认安装即可,其余的安装我这里不再赘述(3)完成上述后,我们实际就已经有了:Nsight Compute:Nsight Systems 2020.3.4:N..原创 2022-05-17 13:46:37 · 1427 阅读 · 0 评论 -
cudaMalloc((void** devPtr,size_t size),内存申请用void**的原因总结(二)
一、前言上一篇文章,我觉得还是有点不是很理解,因此这里继续学习记录一下:我们参考这篇博客:【CUDA】分配内存使用void**_TwT520Ly的博客-CSDN博客在CUDA分配内存的时候,都是使用void**进行内存的分配。我这里自己写了一段代码进行malloc测试:#include <stdlib.h>#include<iostream>void memory(int* p) { std::cout << "p原创 2022-05-15 21:49:33 · 1354 阅读 · 0 评论