GPU高级调试与优化

本文深入探讨GPU的编程挑战,通过NVIDIA、AMD、INTEL和ARM的GPU实例解析内部架构,涵盖CUDA、OpenVX、OpenCL等编程接口,并介绍CUDA-GDB、NSight等调试工具的使用,旨在帮助GPU开发者提升调试和优化技能。
摘要由CSDN通过智能技术生成


GPU的历史很短,只有十几年。但它发展迅猛,凭借强大的并行计算能力和高效率的固定硬件单元,在人工智能、虚拟和增强现实(VR/AR)、3D游戏、视频编解码等领域大显身手。而且这种趋势还在延续,基于GPU的应用和创新势头正猛。

但是从系统架构来看,针对GPU的架构转型还在进行过程中,目前GPU依然还处于外设的地位,还没有摆脱从属身份。因为这个根本特征,对GPU编程并不像对CPU编程那样直接,而调试和优化GPU程序的难度就更大了,要比CPU程序复杂很多。

本研习班从GPU的发展简史入手,沿着GPU的发展历程,从内部结构、硬件接口和软件接口三个维度螺旋推进,深入解析GPU编程的知识要点和难点。硬件方面,以NVIDIAAMDINTELARM四大阵营的GPU产品为例,揭秘GPU的内部架构和执行逻辑,解读其强大并行能力的底层实现。软件方面,深入解析OpenVXOpenCLCUDADirectXOpenGL等编程接口,以及LINUXWindows操作系统下的软件栈,包括DRMWDDM驱动模型、厂商驱动程序等,并介绍优化和调试GPU程序的常用工具和方法。具体由以下12个主题讲解和6个动手试验组成。

 

时间20171215- 1217日(周五-周日)(三天两晚封闭训练,挑灯论剑)

地点:庐山秀峰景区内松雪楼(住)和中正行营(研习)

形式:实战演练、讲解和讨论点评

培训对象:使用GPU进行通用计算和图形加速的软件工程师(开发和测试)、技术经理和科研人员

主办单位:高端调试网站、上海曜印网络科技有限公司

 

序言:三轮演进 0.5小时)

要点:VGA、硬件加速、2D加速和3D加速,从可配置到可编程,GPGPUGPU的四大功能模块,具有里程碑性的产品,TVGAVoodooGeForce 256G80HD 7900HSA

 

-----N-----

 

第一部分:在CUDA-GDB理解CUDA基础(1.5小时)

要点:CUDA简要历史,CUDAC扩展,kernel函数,WARPCUDA的线程组织,准备调试环境,单GPU调试和多GPU调试,远程调试,nvcc-G-g选项,附加到已经运行的进程,启用kernel初始断点,观察源代码和汇编指令,设置断点,单步跟踪,条件断点,观察CUDA的内建变量,理解gridblockthreadGrid-StrideLoops,观察GPU线程,观察GPU的调用栈,观察GPU的寄存器,观察错误信息,产生GPU转储(core dump

 

试验1:熟悉CUDA-GDB的基本用法

编译并调试一个CUDA程序,练习常用的CUDA-GDB扩展命令,理解CUDA编程的关键概念

 

部分:使用NSight调试CUDA程序(1.5小时)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值