自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 资源 (9)
  • 收藏
  • 关注

原创 OpenCL Programming Template -- Juliet

很久了,CSDN博客图片一直处于和谐态,灰常影响博友心情=_=!!! 这里(http://download.csdn.net/source/2030769)有OpenCL开发流程,Platforms/Devices/Context概念澄清的图解,需要的朋友可以下载看看,免积分。本篇我写OCL程序的一个模板,拿出来晒晒太阳,大家喜欢了可以拿去用。CUDA与OpenCL的裙带关系矣然大白于天下

2010-01-28 17:25:00 5311 3

原创 Compiler Optimization on VLIW Instruction Scheduling for Low Power

Compiler Optimization on VLIW Instruction Scheduling for Low PowerChingRen Lee, Jenq Kuen Lee, TingTing HwangNational Tsing-Hua University, TaiwanACM Transactions on Design Automation of Electro

2010-01-07 17:08:00 3362

大稀疏矩阵的存储,文档及源码

大稀疏矩阵的存储,包括:DIA(diagonal non-zeros)、ELLPACK、COO、CSR、HYB(ELLPACK+COO)、DOK(MAP-based)、LIL(List-based)等多种存储格式,内含文档与源码。没有哪种格式占绝对优势,视情况选用。当然还有四元树等其它方法,有兴趣的朋友请留言~

2010-08-24

扩展的高斯卷积算法 X-convolutionSeparable

用高斯核做高斯模糊,先做行再做列。由于SDK里的该例程对图片宽高要求严格,而且边界处理地不甚妥当,于是我进行了适当的扩展,使得其可以处理任意宽*任意高大小的图片,而且经过对边界的clamp处理,使得图片边界不再白白。

2010-02-28

频繁项集挖掘算法的CUDA实现

若干频繁项集挖掘算法的描述及实现思路(CPU、CPU+GPU),主要是Apriori算法(两种CUDA实现,借助bitmap/trie),另外还有对FP-growth算法实现的探讨和K-means聚类算法的简介。Apriori的加速效果最明显(100倍),FP-growth因其树型存储和索引方式不太适合GPU实现。

2010-02-22

CUDA实现稀疏大矩阵乘法

稀疏矩阵的DIA/ELLPACK/COO/CSR/HYB表示形式,以及各表示形式下的稀疏矩阵乘法(稀疏大矩阵*矢量)的CUDA实现。对于矩阵中每一行稀疏元素个数较统一的情况,ELLPACK表示最佳,其次是HYB(ELL+COO)。关于稀疏矩阵的研究很多,这里列出的仅是凤毛麟角,有兴趣的朋友我们一起探讨。

2010-02-21

Compiler Optimization on VLIW Instruction Scheduling for Low Power笔记

"Compiler Optimization on VLIW Instruction Scheduling for Low Power"一文的读书笔记,图文。

2010-02-01

OpenCL开发流程,platform/devices/context概念澄清

图解。关于OpenCL开发流程及platform/devices/context等概念澄清的图示。

2010-01-28

八数码的IDA*算法实现

(内附源码、详细代码注释、测试数据) 源码1:普通IDA*算法实现八数码 源码2:变相IDA*算法实现八数码,ACRush楼天成大牛的2005百度之星巨作,佩服佩服,CPU上平均跑0.0022S

2009-03-17

MartrixAdd_CUDA 矩阵加的CUDA实现

入门练习的小程序,呵呵,CUDA实现矩阵加法。

2009-03-10

BFS_CUDA 广搜的CUDA实现

BFS_CUDA源码,图用邻接链表表示,一层结点并行起来,一结点一线程,复杂度是O(diameter)。具体原理请参见blog.csdn.net/iJuliet

2009-03-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除