CUDA C编程 权威指南 Grossman
文章平均质量分 93
入门CUDA编程的好书
高性能计算工程师
做一个极客!
展开
-
第10章 程序实现的注意事项
了解CUDA的开发过程;使用性能分析工具探索优化因素;使用合适的指标/事件确定最有可能的性能限制因素;结合NVTX库标记出代码的关键部分用于性能分析;使用CUDA调试工具调试CUDA中的内核和内存错误;将实际应用程序由传统的C语言移植CUDA C中;原创 2022-03-04 15:44:55 · 682 阅读 · 0 评论 -
第9章 多GPU编程
多GPU管理;跨多GPU执行核函数;GPU间的叠加计算和通信;GPU间的同步;使用CUDA-aware MPI交换数据;使用GPU Direct RDAM的CUDA-aware MPI交换数据;跨GPU加速集群扩展应用程序;理解CPU和GPU的亲和性;原创 2022-03-04 09:33:31 · 8105 阅读 · 4 评论 -
第7章 调整指令级原语
学习CUDA指令及其在应用程序行为中作用;单精度和双精度数的精确度对比;有关标准函数及CUDA内部函数的性能和精确度实验;从不安全的内存访问发现未定义行为;理解运算指令的意义和使用不当所产生的后果;原创 2022-03-02 14:16:07 · 1230 阅读 · 0 评论 -
第6章 流和并发
理解流和事件本质;理解网格级并发;重叠内核执行和数据传输;重叠CPU和GPU执行;理解同步机制;避免不必要的同步;调整流的优先级;注册设备回调函数;通过NVIDIA可视化;内核级并发;网格级并发;原创 2022-02-27 20:46:36 · 2044 阅读 · 0 评论 -
第5章 共享内存和常量内存
了解数据在共享内存是如何被安排;掌握从二维共享内存到线性全局内存的索引转换;解决不同访问模式中存储体的冲突;在共享内存中缓存数据以减少对全局内存的访问;使用共享内存避免非合并全局内存的访问;理解常量内存和只读缓存的差异;使用线程束洗牌指令编程原创 2022-02-27 14:44:32 · 1585 阅读 · 0 评论 -
第4章 全局内存
学习CUDA内存模型;CUDA内存管理;全局内存编程;探索全局内存访问模式;研究全局内存数据布局;统一内存编程;最大限度地提高全局内存吞吐量;原创 2022-02-11 20:01:26 · 2865 阅读 · 0 评论 -
第2章 CUDA编程模型
写一个CUDA程序;执行一个核函数;用网格和线程块组织线程;GPU性能测试;原创 2021-12-29 20:21:56 · 2090 阅读 · 0 评论 -
第3章 CUDA执行模型
通过配置文件驱动的方法优化内核;理解线程束执行的本质;增大GPU的并行性;掌握网格和线程块的启发式配置;学习多种CUDA的性能指标和事件;了解动态并行与嵌套并行;原创 2022-01-04 16:43:43 · 1532 阅读 · 0 评论 -
第1章 基于CUDA的异构并行计算
了解异构计算架构;认识并行程序设计的范例转换;掌握GPU程序设计的基本要素;了解CPU与GPU编程的区别;原创 2021-12-23 20:22:45 · 1988 阅读 · 0 评论