高性能计算
梦想难吗
每天进步一点点,与君共勉。
本人微信公众号:梦想难吗(微信号:mengxiangnanma)
新浪博客:梦想难吗(地址:http://blog.sina.com.cn/u/5294321827)
豆瓣:梦想难吗
知乎:梦想难吗
展开
-
GPU(CUDA)学习日记(九)------ CUDA存储器模型
CUDA存储器模型:GPU片内:register,shared memory;板载显存:local memory,constant memory, texture memory, texture memory,global memory;host 内存: host memory, pinned memory. register: 访问延迟极低;转载 2012-09-27 10:53:27 · 3536 阅读 · 1 评论 -
GPU(CUDA)学习日记(十)------ Kernal 内核函数 参数的传递
之前做了一个项目,内核函数什么的编写都没有问题,但是处理完的图片就是会产生条纹,这个问题困扰了我很长时间(真的很长时间。。。),我的内核函数传入的参数有很多,我做过实验,在host函数中给所有的参数都cudamalloc显卡空间(当初以为这样处理会更省显存一些,毕竟是开辟的线性存储器globle memory空间),但是实验结果是每一个参数都开辟cudamalloc的话,速度会降低,显卡的显存也没原创 2012-09-27 19:23:23 · 5401 阅读 · 0 评论 -
GPU(CUDA)学习日记(七)------ Parallel Nsight 双机调试经验 以及 一些比较基础的教程
1, 联通两台电脑:准备两台电脑,分别称为主机和调试机,在主机端运行vs2010,在调试机上进行调试,其中至少调试机应支持CUDA,使两台机器在同一个局域网,或直接将两台电脑用网线连接起来; 2, 在主机端设置调试机的IP:在vs2010的解决方案资源管理器中,右键vs2010项目,选择Nsight User Properties,如图所示,在Connection name对应的地原创 2012-09-20 19:00:22 · 7166 阅读 · 1 评论 -
GPU(CUDA)学习日记(八)------ Parallel Nsight2.2调试; CUDA:no source correspandence for breakpoint以及nvcc 命令行
这几天,在弄Parallel Nsight,作为新手的我,也能深深感觉到GPUDebugger --- parallel Nsight的强大,我的机器是win7 x64 + CUDA 4.2 + Parallel Nsight 2.2 ,其实2.2版本的Nsight已经能够单机调试GPU了!这一点真心给力啊!双机调试的经验已经在上一篇文章中介绍过了~其实单机调试也就是把客户端电脑的IP改为自己这台原创 2012-09-21 13:11:17 · 10284 阅读 · 1 评论 -
GPU(CUDA)学习日记(十一)------ 深入理解CUDA线程层次以及关于设置线程数的思考
GPU线程以网格(grid)的方式组织,而每个网格中又包含若干个线程块,在G80/GT200系列中,每一个线程块最多可包含512个线程,Fermi架构中每个线程块支持高达1536个线程。同一线程块中的众多线程拥有相同的指令地址,不仅能够并行执行,而且能够通过共享存储器(Shared memory)和栅栏(barrier)实现块内通信。这样,同一网格内的不同块之间存在不需要通信的粗粒度并行,而一个块原创 2012-12-07 16:30:17 · 19619 阅读 · 5 评论 -
GPU(CUDA)学习日记(十二)------ CUDA并行编程较有用的总结
Cuda并行编程学习时候需注意的一些基本概念1、Cuda的编程风格:spmp(单程序多数据)的并行编程风格。2、在多GPU下,cudaMemcpy()不能用于GPU之间的数据复制3、cudaMemcpy()传输的数据类型有四种:(1) 主机-主机(2) 主机-设备(3) 设备-主机(4) 设备-转载 2012-12-07 16:49:53 · 7869 阅读 · 2 评论 -
GPU(CUDA)学习日记(十四)------CUDA软件更新信息 Parallel Nsight 3.0新特性以及NVAPI介绍
本文主要是介绍CUDA 5以及Parallel Nsight 3.0的新特性,最后会介绍一种可以获得GPU实时状态的NVAPI。本文参考的原文为以下三篇文章以及网站上介绍内容:介绍CUDA 5的新特性:http://blog.csdn.net/openhero/article/details/8561581,介绍Nsight 3.0candidate版的特性:http://blog.csdn.原创 2013-02-28 20:33:18 · 1992 阅读 · 0 评论 -
GPU(CUDA)学习日记(十五) ------ CUDA 5 的一些介绍与下载
关于CUDA 5 的介绍的文章,主要还是以NVIDIA官方的介绍为主吧~http://video.sina.com.cn/v/b/78701598-2755345650.html下面这一篇文章是介绍CUDA 5 新性能的较为简略的文章。http://wenku.it168.com/d_000605327.shtmlWin7下CUDA5.0+VS2010环境配置 的文章:http:/原创 2013-03-22 10:38:11 · 2018 阅读 · 0 评论