自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

SYP___

WHH

  • 博客(8)
  • 资源 (1)
  • 收藏
  • 关注

转载 CUDA 学习笔记七

这节是关于Branch Divergence and Unrolling Loop。Avoiding Branch Divergence有时,控制流依赖于thread索引。同一个warp中,一个条件分支可能导致很差的性能。通过重新组织数据获取模式可以减少或避免warp divergence(该问题的解释请查看warp解析篇)。The Parallel Reduction Problem...

2018-08-07 10:47:33 268

转载 CUDA 学习笔记六

Exposing Parallelism这部分主要介绍并行分析,涉及掌握nvprof的几个metric参数,具体的这些调节为什么会影响性能会在后续博文解释。代码准备下面是我们的kernel函数sumMatrixOnGPUD: __global__ void sumMatrixOnGPU2D(float *A, float *B, float *C, int NX, int N...

2018-08-07 10:38:36 197

转载 CUDA 学习笔记五

Warp逻辑上,所有thread是并行的,但是,从硬件的角度来说,实际上并不是所有的thread能够在同一时刻执行,接下来我们将解释有关warp的一些本质。Warps and Thread Blockswarp是SM的基本执行单元。一个warp包含32个并行thread,这32个thread执行于SMIT模式。也就是说所有thread执行同一条指令,并且每个thread会使用各自的da...

2018-08-07 10:34:49 319

转载 CUDA 学习笔记四

GPU架构SM(Streaming Multiprocessors)是GPU架构中非常重要的部分,GPU硬件的并行性就是由SM决定的。以Fermi架构为例,其包含以下主要组成部分:CUDA cores Shared Memory/L1Cache Register File Load/Store Units Special Function Units Warp Schedul...

2018-08-07 10:32:08 241

转载 CUDA 学习笔记三

device管理NVIDIA提供了集中凡是来查询和管理GPU device,掌握GPU信息查询很重要,因为这可以帮助你设置kernel的执行配置。本博文将主要介绍下面两方面内容:CUDA runtime API function NVIDIA系统管理命令行使用runtime API来查询GPU信息你可以使用下面的function来查询所有关于GPU device 的信息:c...

2018-08-07 10:31:10 215

转载 CUDA 学习笔记二

前言线程的组织形式对程序的性能影响是至关重要的,本篇博文主要以下面一种情况来介绍线程组织形式:2D grid 2D block一些基本的描述:gridDim.x-线程网络X维度上线程块的数量gridDim.y-线程网络Y维度上线程块的数量blockDim.x-一个线程块X维度上的线程数量blockDim.y-一个线程块Y维度上的线程数量blockIdx.x-线程网络X维度上的线程块索...

2018-08-07 10:28:33 263

转载 CUDA 学习笔记一

本系列的CUDA转自:http://www.cnblogs.com/1024incn/tag/CUDA/版权归原作者所有,仅供学习。由于各种需求,所以略微了解学习一下gpu的CUDA怎么操作?CUDA简介CUDA是并行计算的平台和类C编程模型,我们能很容易的实现并行算法,就像写C代码一样。只要配备的NVIDIA GPU,就可以在许多设备上运行你的并行程序,无论是台式机、笔记本抑或平...

2018-08-07 10:22:11 288

原创 CUDA 学习二: 核函数的调用

按照GPU高性能编程cuda实战进行学习。 

2018-08-05 09:35:03 2139

django的xadmin安装包(亲测有效 无bug)

django-crispy-forms>=1.6.0 django-import-export>=0.5.1 django-reversion>=2.0.0 django-formtools==2.1 future==0.15.2 httplib2==0.9.2 six==1.10.0

2020-12-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除