自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

k531623594的专栏

来给你的照片去去噪吧

  • 博客(11)
  • 资源 (1)
  • 收藏
  • 关注

原创 基于Cuda的几种并行稀疏矩阵乘法方法(一)

最近由于研究需要和兴趣看了很多稀疏矩阵乘法的算法,这方面的研究千奇百怪,研究人员真的是十八般武艺全都用上了,好吧,就让我来说说这个东西吧,由于这个东西实在方法太多,所以请容许我一节一节地去完善。   1、存储方式   稀疏矩阵的存储方式真的非常多,也各有千秋,它们包括CSR(许多库的首选存储方式),COO(MATLAB存储稀疏矩阵的方式),CSC(这个也可以看成是CSR,做个转置就完了),ELL

2016-05-13 14:48:39 7588 3

原创 programming massively parrellel processors(1)

I have to say this is a very good book to learn more about cuda, especially for a novice like me, who take interest in parallel computing and is not content with cuda programming guide.   There are se

2016-04-20 17:53:42 880

原创 论文纠错(一)

说说最近读的几篇论文的问题,果然有的论文还是不能细细地去读,一读就发现有问题。   第一个是MSPCA里面的公式(7)到公式(8),那个Sr前面的2是不应该有的,也就是推导的时候出错了。   第二个是GPUTENSOR里面的Gpu_product的算法,并不能get到warp的Id,我很想知道是不是把block写成warp了。。。或者说是一个block里面就是32个thd,所以索性写成warp?

2016-04-19 18:10:52 1472

原创 cublasSgemm和cublasDgemm的比较

我的电脑的GPU是GeForce 410M的。比较老旧了,当年高考完买的。为了验证NVIDIA在游戏卡系列到底砍了多少双精度计算能力,这一次总共做了三个实验,截图保存了,值得一提的是,当矩阵维度到了3000维的时候。。。 所以读者看到这里就懂为啥我的工具箱的精度会有问题了吧。。。我无耻了一把。。。

2016-04-13 22:32:53 2557

原创 Accelerated tensor_toolbox version 1.0

基于张量分解的MATLAB工具箱已经来到了2.6版,但是在使用过程中仍有许多不尽如人意的地方,比如说,计算速度比较慢,而且作者似乎一开始就没有考虑大规模的问题。为了解决这些问题的一个或几个,笔者花了将近两个月的时间研究CUDA和MATLAB的混合编程,目前终于是做出了1.0版本的tensor_toolbox的加速工具箱。虽然我很想开源供大家使用,但是基于版权的问题还是没有办法将它做到开源(但是相信读

2016-04-13 21:48:17 625

原创 LASSO和LARS

1、LASSO简介   LASSO是一种经典的松弛算法,其全称是The Least Absolute Shrinkage and Selectionator operator,于1996年由Tibshirani提出来。lasso的一个根本思想就是利用L1范式来诱导稀疏解,下面给出lasso的两种形式以及其等价性证明,至于lambda和t的对应关系以后再给出。      这张图片由Le.Han老

2016-04-05 12:16:33 7786

原创 cusparse的使用

1、cusparse简介   cusparse是一个非常好的进行系数代数运算的库。不得不提到的是,它的效率是相当高效的,尤其是当进行大规模的稀疏计算的时候,cuda的优势就体现得淋漓尽致了(相比于MATLAB而言)。先说明一下,如果你是一个有着丰富编程经验的老手,那么本文对于你可能没有太大作用,然而如果你是想使用cusparse加速程序的新手,本文可以为你节约相当的时间。2、稀疏矩阵于一般矩阵的乘法

2016-03-30 22:16:05 7414 3

原创 配置cublas

cublas的配置方法  cublas是一个非常好用的cuda库,里面集成了相当多的和GPU相合(tuned)的库函数,相当好用,但如果不会配置还真的是挺头疼的,我在网上找的很多文章都有cublas的配置方法,但是对于我的平台来说都不是非常靠谱,现在我说说我遇到的问题和解决方法:   我的问题和很多人问的都一样,就是各种无法解析的外部符号,出现这种问题其实就是库没有链接到,网上有很多答案都提到了,

2016-03-22 19:06:37 3235 7

原创 利用cuda加速MATLAB程序

利用cuda加速MATLAB程序利用cuda加速MATLAB程序1参考木子超的办法2参考Tomheaven的方法3引用  最近因为要做张量的模态积,所以要考虑使用cuda来进行并行的编程,但是c++实在太麻烦,尤其是在有MATLAB的时候,写c++简直就是一种“浪费时间”的行为。如果能用MATLAB调用cuda的程序那该是一件多么美好的事情呀。   确实,这件事情非常美...

2016-03-18 14:19:24 12688 2

原创 matlab和C++混编(1)配置开发环境

matlab和C++混编(1)配置开发环境

2016-03-14 22:09:29 1309

原创 基于单边jacobi的奇异值分解(SVD)

基于单边jacobi的奇异值分解(SVD)对于奇异值分解(SVD),相信很多学过线性代数/高等代数的同学都不会很陌生,但是怎么实现呢?接下来就来详细说说。  为了方便讨论,本文所有的讨论仅限定于实数空间。奇异值分解的含义就是将矩阵A分解成一个酉矩阵U,一个准对角矩阵S还有一个酉矩阵V。首先要说明一点,SVD分解是存在的但不唯一,这个有兴趣的读者可以思考一下。利用数学公式可以写成:  A=USV′

2016-02-03 10:24:05 11094 2

CVX和MATLAB编程

CVX指导Guide,包括了一些例子以及其他关于MATLAB与CVX混合编程的技巧

2015-05-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除