CUDA
文章平均质量分 75
DSQ_17
这个作者很懒,什么都没留下…
展开
-
CUDA的线程块size
前面扯了很多,不过大多都是在讲CUDA 在软体层面的东西;接下来,虽然Heresy 自己也不熟,不过还是来研究一下硬体的部分吧~毕竟要最佳化的时候,好像还是要大概知道一下相关的东西的。这部分主要参考资料是:[Hotball's Hive]GPU 的硬体架构Programming Massively Parallel Processors的Lecture 7在研究硬体架构前,转载 2014-03-18 14:21:43 · 1980 阅读 · 0 评论 -
vs2010下配置CUDA出现kernel launch failed问题,内核无效
首先,推荐一篇不错的配置文档~手把手教你 CUDA 5.5与VS2010编译环境的搭建,笔者就是在这篇文章的指导下成功地在VS2010上搭建了CUDA 6.5~其次,文末给出的运行示例不好使,运行时总会提示kernel无法启动~经过多方搜索,查阅相关资料,甚至拿出CUDA自带的samples比较编译选项,终于解决了问题。方法便是在项目属性,C++ CUDA –> device下修改一下编译选项。在这原创 2015-08-21 16:51:32 · 3014 阅读 · 0 评论 -
使用CUBLAS的一些小例子
#include "cuda_runtime.h"#include "cublas_v2.h"#include #include using namespace std;int const M = 6;int const N = 10;int main(){ cublasStatus_t status; //Host memory malloc float *h_原创 2015-08-25 16:28:48 · 3850 阅读 · 0 评论 -
如何在VS中像MATLAB中一样做矩阵运算
What do we need?Armadillo Armadillo 【1】是一个高质量的C++线性代数库,目的是在运算速度与易用性之间取一个折衷。它其实是对底层的矩阵运算库(例如BLAS,LAPACK)的封装,也就是说,这个库本身的计算能力其实不强,但是这个库可以配合开源的底层库来使用。MinGW MinGW【3】是Mi原创 2015-08-25 17:37:45 · 3932 阅读 · 0 评论 -
CUDA从入门到精通
CUDA从入门到精通(零):写在前面在老板的要求下,本博主从2012年上高性能计算课程开始接触CUDA编程,随后将该技术应用到了实际项目中,使处理程序加速超过1K,可见基于图形显示器的并行计算对于追求速度的应用来说无疑是一个理想的选择。还有不到一年毕业,怕是毕业后这些技术也就随毕业而去,准备这个暑假开辟一个CUDA专栏,从入门到精通,步步为营,顺便分享设计的一些经验教训,希望能转载 2015-08-27 21:26:02 · 1128 阅读 · 0 评论