CUDA概念
- sp:小核(流处理器)最基本的处理单元
- sm:大核(流多处理器)
- wrap:GPU执行程序的调度单位
- grid:有多个block
- block:有多个thread
- thread
利用图形API和CUDA进行GPU通用计算的性能差别
- 需要将问题转化成图形学,而CUDA使用C语言编写,适合做通用计算
GPU指令和CPU指令 最大区别:CPU需要运行OS,不但要处理中断,还要负责存储器空间分配回收,GPU不需要做这些,所以GPU很空闲
GPU架构缺点:精度问题,编程模式不太灵活
CPU切换线程成本高
优化方法
- 对于block和thread分配问题:一个block要有32个thread