cuda资料
文章平均质量分 61
jasonscau
研究生,技术特点:C/VC 、J2EE
展开
-
sdk project 列表
CUDA开发者软件开发包(SDK)提供了一些范例(附有源代码),以帮助使用者开始CUDA编程。这些范例包括: · 并行双调排序 · 矩阵乘法 · 矩阵转置 · 利用计时器进行性能评价 · 并行大数组的前缀和(扫描) · 图像卷积 · 使用Haar小波的一维DWT · OpenGL和Direct3D图形互操作示例 · CUDA原创 2010-03-26 19:58:00 · 413 阅读 · 0 评论 -
CUDA 的 Threading:Block 和 Grid 的設定與 Warp
CUDA 的 device 實際在執行的時候,會以 Block 為單位,把一個個的 block 分配給 SM 進行運算;而 block 中的 thread,又會以warp為單位,把 thread 來做分組計算。目前 CUDA 的 warp 大小都是 32,也就是 32 個 thread 會被群組成一個 warp來一起執行;同一個 warp 裡的 thread,會以不同的資料,執行同樣转载 2010-03-30 17:23:00 · 1005 阅读 · 0 评论 -
CUDA程序初窥
在网上看到一篇比较不错的CUDA工程模板程序的详细分析文章,大家可以用来了解一个CUDA程序的基本结构。转载于http://blog.csdn.net/darkstorm2111203/archive/2008/08/22/2813480.aspx。 /* Template_Host.c 用于演示如何生成cuda工程的样本程序 *//* 主机端,也就是cpu code*/转载 2010-04-02 22:26:00 · 945 阅读 · 0 评论 -
CUDA编程——纹理
(一)纹理属性(二)纹理拾取函数(三)拾取纹理内存与读取全局或常量内存相比的优点 (一)纹理属性纹理可以在线性内存或是CUDA数组(纹理内存)的任何区域。所以纹理拾取也就对存在与线性内存或CUDA数组中的纹理读取数据。共用运行组件(既可以运行在host又可以运行在设备)中给出了纹理类型texture。纹理拾取的第一个参数就是纹理参考,纹理参考定义要拾取哪部分纹理内存,转载 2010-04-07 23:36:00 · 542 阅读 · 0 评论 -
NVIDIA's GT200--- Inside a Parallel Processor
本文是Davick kanter博士的《NVIDIAs GT200--- Inside a Parallel Processor》的部分中文译文简介过去十年中,计算领域出现了一个新的发展趋势。由Intel,IBM,SUN,AMD和富士通生产的通用CPU虽然有了很大发展,但性能提高速度却已经不能与与上世纪八十年代末九十年代初相比。单线程处理性能在很大程度上受到了限制。这些限制一方面来自于通用计转载 2010-04-22 16:59:00 · 862 阅读 · 0 评论 -
使用 Visual Studio 分析器找出应用程序瓶颈
使用 Visual Studio 分析器找出应用程序瓶颈http://msdn.microsoft.com/zh-cn/magazine/cc337887.aspx#S1转载 2010-05-06 20:38:00 · 446 阅读 · 0 评论