CUDA经验记录1

一、安装后vs找不到模板
新建项目找不到模板,添加项有模板。网上方法分两种:重装和加快捷方式控制台输命令,都试了,都不行。最后把vs从2019降到2017,cuda从11.1.1降到10.0就好了,分析原因如下:
(1)cuda和vs在相互升级的过程中可能兼容没做好。
(2)显卡是GTX1050ti,可能在支持它之后的高版本驱动有漏洞,显卡old了。
二、CUDA简介
2006年,NVIDIA公司发布了CUDA,CUDA是建立在NVIDIA的CPUs上的一个通用并行计算平台和编程模型,基于CUDA编程可以利用GPUs的并行计算引擎来更加高效地解决比较复杂的计算难题。近年来,GPU最成功的一个应用就是深度学习领域,基于GPU的并行计算已经成为训练深度学习模型的标配。
host指代CPU及其内存,而用device指代GPU及其内存。CUDA程序中既包含host程序,又包含device程序,它们分别在CPU和GPU上运行。同时,host与device之间可以进行通信,这样它们之间可以进行数据拷贝。
典型的CUDA程序的执行流程如下:
(1)分配host内存,并进行数据初始化;
(2)分配device内存,并从host将数据拷贝到device上;
(3)调用CUDA的核函数在device上完成指定的运算;
(4)将device上的运算结果拷贝到host上;
(5)释放device和host上分配的内存。
kernel是在device上线程中并行执行的函数,核函数用__global__符号声明,在调用时需要用<<<grid, block>>>来指定kernel要执行的线程数量,在CUDA中,每一个线程都要执行核函数,并且每个线程会分配一个唯一的线程号thread ID,这个ID值可以通过核函数的内置变量threadIdx来获得。
在CUDA中是通过函数类型限定词开区别host和device上的函数:
(1)global:在device上执行,从host中调用(一些特定的GPU也可以从device上调用),返回类型必须是void&

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值