自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (6)
  • 问答 (1)
  • 收藏
  • 关注

转载 CUDA:低占用率下的更好性能(三)

前两部分是有关ILP隐藏计算和访存延迟,从而在GPU低占用率的情况下达到高并行度和吞吐率。下一部分是讨论在共享内存(shared memory)和寄存器(register)之间的权衡,作者从吞吐率的角度上说明使用共享内存达不到最好性能,最好降低占用率从而尽可能多的使用寄存器。------------------------------------------------------------

2014-04-11 09:35:28 479

转载 CUDA:低占用率下的更好性能(二)

http://blog.sina.com.cn/s/blog_70684c2a0100vjif.html

2014-04-11 09:34:04 696

转载 CUDA:低占用率下的更好性能(一)

这两天看到Vasily Volkov牛人的ppt,对如何更有效的使用GPU做通用计算提出了增加线程级并行以外的另一种方法---增加指令级并行,受益匪浅。刚好也没找到中文版本,就翻译过来与大家交流下,有错误请各位牛人指正,所有的实验结果和图片均出自原ppt。请参考《Better Performance at Lower Occupancy》后面两个案例有时间会放上来... -----

2014-04-11 09:30:31 1163

转载 寄存器使用过多成为CUDA程序瓶颈的情况分析

原文地址: 作者:事实上,寄存器数量限制程序性能的案例还是比较少的。首先您要明确是否真的是此因素导致了您程序性能无法进一步提升。寄存器影响主要两个方面:active warp 的数量(即occupancy )和寄存器溢出导致的local memory的传输。首先看active warp:什么时候是因为寄存器使用过多导致active warp数量少,导致性能低呢?

2014-04-11 09:25:14 2916

万年日历系统

1)提供菜单方式选择,假定输入的年份在1940-2040年之间。(2)输入一个年份,输出是在屏幕上显示该年的日历。(3)输入年月,输出该月的日历。如: (4)输入年份、月份、日期,计算得到的是这一天据今天有多少天,星期几;(5)输入公历的年月日,输出农历年月日。(6)输入农历节气,输出当年农历的年月日及公历年月日。可以假定只涉及年份是1940年到2040年。

2014-07-18

kmeans算法并行化

本代码是全局kmeans算法在异构架构下的实现,使用cuda c语言编写。(声明,改代码是一位大牛所写,希望对你有用)

2014-04-11

Win7下CUDA5.0+VS2010环境配置

详细的介绍了win7环境下cuda5.0及vs2010的配置,并详细的介绍了如何cuda环境下CUDA C/C++关键字及函数高亮显示

2014-04-11

J2ee实验报告

j2ee使用教程实验报告,有详细的代码。

2014-01-11

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除