看cuda初级教程视频笔记(周斌讲的)--CUDA编程1

本文是CUDA编程的初步学习笔记,介绍了GPU从作为GPGPU的角色转变,到CUDA架构的出现,以及OpenCL的标准化。重点讲解了CUDA中的线程组织、共享内存和同步,以及如何使用CUDA进行矩阵乘法操作,包括内存管理和并行运算的步骤。还提到了cudaMemcpy函数在内存传输中的应用,以及矩阵乘法的计算复杂度。最后,对于实际编程中遇到的线程数量限制问题进行了思考。
摘要由CSDN通过智能技术生成

01年开始,研究人员把GPU当做数据并行协处理器(GPGPU)

07年,英伟达发布CUDA (Compute Uniform Device Architecture)统一计算设备架构

08年,OpenCL规范,使得并行计算可以扩展到更多设备平台上去

CUDA的一些信息(线程嘛)

层次化线程集合A hierarchy of thread groups,共享储存Shared memories,同步Barrier Synchronization

CUDA术语 Host和device通常就是指cpu和gpu,采用ANSI标准C的扩展语言编程,编程时候,有主机端和设备端两部分的代码

Kernel,数据并行处理函数,在设备端有硬件负责创建调度线程,在主机端调这个函数



想吃饭了,先不写了~哈哈哈

隔了四天接着学,接着写


float *Md
int size=width*width*sizeof(float);
cudaMalloc((void**)&Md,size);
...
cudaFree(Md);

这个(void**)&Md指针是指向设备的指针,cpu不能调用

cudaMemcpy()内存传输 :主机端向主机端,设备端向设备端,主机端向设备端,设备端向主机端

cudaMemcpy(目的地址,原地址,大小,cudaMemcpyHostToDevice);

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值