自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 资源 (1)
  • 收藏
  • 关注

原创 CUDA Toolkit Documentation 1

Hardware Implementation NVIDIA GPU体系结构由一组可扩展的多线程流式多处理器(Streaming Multiprocessors)组成SM包括 用于线程执行的数以千计的寄存器 多级缓存  - 用于线程间数据交换的shared memory  - 用于从constant memory快速读取的constant cache  - 用于提升texture ...

2018-10-06 23:58:48 642

转载 分支分歧(branch divergence)造成SIMT性能降低的原因

分支分歧(branch divergence)造成SIMT性能降低的原因warp中的线程按照SIMD(Single Instruction Multiple Data)模式执行——它们执行相同的代码,但处理不同的数据。当遇到分支指令时,执行不同分支路径的线程只能串行执行。这种因不一致分支行为引起的串行执行现象被称作Branch Divergence,它的出现严重影响了GPU的执行效率,降低了程...

2018-08-30 11:40:39 2373

CUDA C编程权威指南

CUDA C编程权威指南及源码,仅供学习使用。如有版权侵犯,联系本人。

2018-10-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除