gpu
文章平均质量分 71
sunmenggmail
这个作者很懒,什么都没留下…
展开
-
CUDA编程指南阅读笔记(六)
4. CUDA C语言编程接口 接上文。4.3 CUDA C Runtime4.3.3 共享内存(Shared Memory) 共享内存是CUDA设备中非常重要的一个存储区域,有效地使用共享内存可以充分利用CUDA设备的潜能,极大提升程序性能。那么,共享内存有哪些特点呢? 1、共享内存(shared Memory)是集成在GPU处理器芯转载 2014-07-28 16:02:25 · 912 阅读 · 0 评论 -
leading dimension
矩阵空间是 3x4,其左上角原创 2014-08-20 02:27:28 · 6698 阅读 · 0 评论 -
gpu合并访问和取模对速度的影响
#include #include #include #include #include #include #include using namespace std;#define IDX2C(i,j,rows) (((j)*(rows)+(i)))#define IDX2R(i,j,cols) (((i)*(cols)+(j)))#define BLOCK_SIZE 32原创 2015-01-06 14:41:42 · 1531 阅读 · 0 评论 -
gpu排序
单机版的双调排序可以参考 http://blog.csdn.net/sunmenggmail/article/details/42869235还是这张图片基于cuda的双调排序的思路是:为每一个元素提供一个线程,如果大于1024个元素,还是提供1024个线程,这是因为__syncthreads只能作为block内的线程同步,而一个block最多有1024个线程,如果元素原创 2015-01-19 19:42:50 · 7843 阅读 · 1 评论 -
cuda版本的word2vec
上篇博客的快排中用到了基于warp的cuda操作用于分隔数组, 为什么要将控制线程的级别定义为warp呢?在一个warp内,线程的可以通过__ballot函数,并发的获取这32个数中于pivot的比较结果,然后通过ptx类似汇编的语句asm("mov.u32 %0, %%lanemask_lt;" : "=r"(lane_mask)) 获得线程在warp内的位置的掩码,再按位与之后调用 __p原创 2015-01-20 17:22:23 · 2812 阅读 · 1 评论 -
CUDA在Windows下的软件开发环境搭建
http://www.cnblogs.com/yaoyuanzhi/archive/2010/11/13/1876215.htmlCUDA在Windows下的软件开发环境搭建 本文我们以Visual Studio 2005 为例演示CUDA的安装以及软件开发环境搭建,以及CUDA与MFC联调的实现。1.cuda安装包CUDA是免费使用的,各种操作系统下的CUDA转载 2014-10-16 15:41:35 · 7300 阅读 · 0 评论 -
Windows8.1 64bit环境下搭建深度学习平台之CUDA安装与配置
http://blog.csdn.net/baigoocn/article/details/36188029说明:想要让Theano在Windows8.1下能利用GPU并行运算,必须有支持GPU并行运算的Nvidia显卡,且要安装CUDA,千万不要电脑上是Intel或AMD的显卡,却要编写CUDA。文中用到的所有软件均共享在百度云盘中,方便大家的使用!!链接:h转载 2014-10-16 10:52:53 · 14165 阅读 · 1 评论 -
深度神经网络DNN的多GPU数据并行框架 及其在语音识别的应用
http://www.csdn.net/article/2014-07-11/2820628-DNN深度神经网络(Deep Neural Networks, 简称DNN)是近年来机器学习领域中的研究热点,产生了广泛的应用。DNN具有深层结构、数千万参数需要学习,导致训练非常耗时。GPU有强大的计算能力,适合于加速深度神经网络训练。DNN的单机多GPU数据并行框架是腾讯深度学习平台的转载 2014-11-17 09:34:46 · 5242 阅读 · 0 评论 -
theano安装
http://blog.csdn.net/lucktroy/article/details/9336477http://blog.sina.com.cn/s/blog_6cb8e53d0101keak.html因为想安装Theano到系里的电脑上,但是本人并没有root权限,无奈在google group之theano-user上发帖问大神[注1有对话 : ) ]。转载 2014-08-01 09:36:22 · 7194 阅读 · 0 评论 -
linux下显卡信息的查看
http://blog.csdn.net/wind19/article/details/17095541lspci | grep -i vga这样就可以显示机器上的显卡信息,比如 [root@localhost conf]# lspci | grep -i vga01:00.0 VGA compatible controller: nVidia Corporati转载 2014-07-29 16:57:59 · 6683 阅读 · 0 评论 -
MPICH3环境配置
http://blog.csdn.net/yutianzuijin/article/details/9141401最新版的mpich简化了运行方式,不再提供mpd开头的命令,只需要一个mpiexec即可启动mpi运行环境,方便了mpi编程。源代码下载地址:http://www.mpich.org/downloads/。不过和之前的版本一样,在运行mpi程序时,首先要配置好系统环境。转载 2015-06-05 11:43:38 · 1230 阅读 · 0 评论