![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
cuda
文章平均质量分 56
卖刻耳乔丹
绝知此事要躬行。
展开
-
cusparse的使用
1、cusparse简介 cusparse是一个非常好的进行系数代数运算的库。不得不提到的是,它的效率是相当高效的,尤其是当进行大规模的稀疏计算的时候,cuda的优势就体现得淋漓尽致了(相比于MATLAB而言)。先说明一下,如果你是一个有着丰富编程经验的老手,那么本文对于你可能没有太大作用,然而如果你是想使用cusparse加速程序的新手,本文可以为你节约相当的时间。2、稀疏矩阵于一般矩阵的乘法原创 2016-03-30 22:16:05 · 7431 阅读 · 3 评论 -
配置cublas
cublas的配置方法 cublas是一个非常好用的cuda库,里面集成了相当多的和GPU相合(tuned)的库函数,相当好用,但如果不会配置还真的是挺头疼的,我在网上找的很多文章都有cublas的配置方法,但是对于我的平台来说都不是非常靠谱,现在我说说我遇到的问题和解决方法: 我的问题和很多人问的都一样,就是各种无法解析的外部符号,出现这种问题其实就是库没有链接到,网上有很多答案都提到了,原创 2016-03-22 19:06:37 · 3236 阅读 · 7 评论 -
Accelerated tensor_toolbox version 1.0
基于张量分解的MATLAB工具箱已经来到了2.6版,但是在使用过程中仍有许多不尽如人意的地方,比如说,计算速度比较慢,而且作者似乎一开始就没有考虑大规模的问题。为了解决这些问题的一个或几个,笔者花了将近两个月的时间研究CUDA和MATLAB的混合编程,目前终于是做出了1.0版本的tensor_toolbox的加速工具箱。虽然我很想开源供大家使用,但是基于版权的问题还是没有办法将它做到开源(但是相信读原创 2016-04-13 21:48:17 · 627 阅读 · 0 评论 -
cublasSgemm和cublasDgemm的比较
我的电脑的GPU是GeForce 410M的。比较老旧了,当年高考完买的。为了验证NVIDIA在游戏卡系列到底砍了多少双精度计算能力,这一次总共做了三个实验,截图保存了,值得一提的是,当矩阵维度到了3000维的时候。。。 所以读者看到这里就懂为啥我的工具箱的精度会有问题了吧。。。我无耻了一把。。。原创 2016-04-13 22:32:53 · 2560 阅读 · 0 评论 -
基于Cuda的几种并行稀疏矩阵乘法方法(一)
最近由于研究需要和兴趣看了很多稀疏矩阵乘法的算法,这方面的研究千奇百怪,研究人员真的是十八般武艺全都用上了,好吧,就让我来说说这个东西吧,由于这个东西实在方法太多,所以请容许我一节一节地去完善。 1、存储方式 稀疏矩阵的存储方式真的非常多,也各有千秋,它们包括CSR(许多库的首选存储方式),COO(MATLAB存储稀疏矩阵的方式),CSC(这个也可以看成是CSR,做个转置就完了),ELL原创 2016-05-13 14:48:39 · 7600 阅读 · 3 评论 -
programming massively parrellel processors(1)
I have to say this is a very good book to learn more about cuda, especially for a novice like me, who take interest in parallel computing and is not content with cuda programming guide. There are se原创 2016-04-20 17:53:42 · 888 阅读 · 0 评论 -
利用cuda加速MATLAB程序
利用cuda加速MATLAB程序利用cuda加速MATLAB程序1参考木子超的办法2参考Tomheaven的方法3引用 最近因为要做张量的模态积,所以要考虑使用cuda来进行并行的编程,但是c++实在太麻烦,尤其是在有MATLAB的时候,写c++简直就是一种“浪费时间”的行为。如果能用MATLAB调用cuda的程序那该是一件多么美好的事情呀。 确实,这件事情非常美...原创 2016-03-18 14:19:24 · 12704 阅读 · 2 评论