GPU高级调试与优化(2018SH)

[纠正上一版本小错误,重新发送,如有打扰,请原谅]

GPU的历史很短,只有十几年。但它发展迅猛,凭借强大的并行计算能力和高效率的固定硬件单元,在人工智能、虚拟和增强现实(VR/AR)、3D游戏、视频编解码等领域大显身手。而且这种趋势还在延续,基于GPU的应用和创新势头正猛。

但是从系统架构来看,针对GPU的架构转型还在进行过程中,目前GPU依然还处于外设的地位,还没有摆脱从属身份。因为这个根本特征,对GPU编程并不像对CPU编程那样直接,而调试和优化GPU程序的难度就更大了,要比CPU程序复杂很多。

本研习班从GPU的发展简史入手,沿着GPU的发展历程,从内部结构、硬件接口和软件接口三个维度螺旋推进,深入解析GPU编程的知识要点和难点。硬件方面,以NVIDIAAMDINTELARM四大阵营的GPU产品为例,揭秘GPU的内部架构和执行逻辑,解读其强大并行能力的底层实现。软件方面,深入解析OpenVXOpenCLCUDADirectXOpenGL等编程接口,以及LINUXWindows操作系统下的软件栈,包括DRMWDDM驱动模型、厂商驱动程序等,并介绍优化和调试GPU程序的常用工具和方法。具体由以下12个主题讲解和6个动手试验组成。

 

时间2018119- 121日(周五-周日)

地点:上海

形式:实战演练、讲解和讨论点评

培训对象:使用GPU进行通用计算和图形加速的软件工程师(开发和测试)、技术经理和科研人员

主办单位:博览网、高端调试网站、上海曜印网络科技有限公司

 

序言:三轮演进 0.5小时)

要点:VGA、硬件加速、2D加速和3D加速,从可配置到可编程,GPGPUGPU的四大功能模块,具有里程碑性的产品,TVGAVoodooGeForce 256G80,Brook和CUDA,HD 7900HSA

 

-----N-----

 

第一部分:在CUDA-GDB理解CUDA基础(1.5小时)

要点:CUDA简要历史,CUDAC扩展,kernel函数,WARPCUDA的线程组织,准备调试环境,单GPU调试和多GPU调试,远程调试,nvcc-G-g选项,附加到已经运行的进程,启用kernel初始断点,观察源代码和汇编指令,设置断点,单步跟踪,条件断点,观察CUDA的内建变量,理解gridblockthreadGrid-StrideLoops,观察GPU线程,观察GPU的调用栈,观察GPU的寄存器,观察错误信息,产生GPU转储&#

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值