CUDA入门学习总结

源于CUDA的异构并行计算

  1. GPU必须通过PCIe总线与基于CPU的主机相连,GPU称作设备端,CPU称作主机端
  2. 异构的代码包括:设备代码+主机代码
  3. 评估GPU性能:峰值计算性能(GFlops/TFlops/PFlops) + 内存带宽
  4. 为了支持使用CPU+GPU异构系统架构来执行应用程序,NVIDIA设计CUDA的编程模型
  5. CUDA运行时API基于驱动API封装,更容易使用,两种API相互排斥,只能使用其中一个
  6. 主机代码是C代码,设备代码是CUDA C代码,在链接阶段,内核程序调用时和显示GPU设备操作中添加CUDA运行时库,通过nvcc进行编译

CUDA编程模型

CUDA执行模型

全局内存

共享内存和常量内存

流和并发

调整指令级原语

GPU加速库 & OpenACC

多GPU编程

注意事项

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值