自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

荆棘鸟的专栏

坚持梦想,永不懈怠,一往无前!

  • 博客(2)
  • 收藏
  • 关注

原创 一个关于消除数据依赖性的问题

for (k = 0; k                 A[B[k]] *= C[k]; 复制代码    这段代码中A数组是一段包含m个元素的数组,B数组是一段包含max(max远大于m)个元素的数组,C同样是一段包含max个元素的数组。且B数组中所有元素的值都取在0-m之间。      因为这段代码包含着数据依赖性问题,所以不能直接在CUDA上并行,否则取值会有冲突与覆盖

2015-04-21 21:43:00 2591 3

原创 CUDA程序优化时中关于并行性杂谈。

今天终于将困扰我好久,令我程序优化进程受阻的问题找到了,其实仔细排查不难发现这个问题,但是当从整体来看时,问题很难准确抓到,而且由于基础不深,在这上面耽搁了很久,一边耽搁也在一边学习,黄天不负苦心人,终于让我找到问题所在!今天来谈一谈最近的收获。   CUDA并行代码优化时,我习惯将串行代码原生态在并行方式上实现,由于这是第一次用CUDA,所以并没有加入很多优化方法,在这个最基本的进程中,我觉得

2015-04-11 22:12:36 1386 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除