CUDA
文章平均质量分 76
ZzConstantly
这个作者很懒,什么都没留下…
展开
-
CUDA Review
1. GPU硬件特性1.1 存储层次1.1.1 Global memory:1) 大小一般为几GB2) chip-off的DRAM介质存储器3) 访问速度慢(是shared memory的上百倍)4) 对于是否对齐和连续访问敏感(由DRAM的性质决定)(Remember:When using global memory to read and write a la转载 2015-02-02 14:49:08 · 818 阅读 · 0 评论 -
Nsight调试笔记
Problem 1: Low Memcpy/Compute OverlapThe percentage of time when memcpy is being performed in parallel with compute is low.Nsight手册第九章 Memory Optimizations9.1 Data Transfer Between Host and Devi原创 2015-02-02 15:34:07 · 1772 阅读 · 0 评论 -
CUDA远程调用—完整教程
毕业设计的题目跟CUDA有关,本人的笔记本用的是A卡(悔恨当初怎么没买N卡的机子),托老师找人借了台N卡机器。之前,在网上找了很久远程调用CUDA的方法,资料很少。 大体总结一下,基本上有两种方法: 方法一、使用CUDA提供的Nsight远程调用调试(详见 点击打开链接),这是网上提供的方法,本人并没有验证。 方法二、使用RealVNC远程连接PC或原创 2015-01-10 14:59:39 · 3777 阅读 · 0 评论 -
LaTex常用符号(很全,再也不用网上查了)
LaTeX Math SymbolsPrepared by L. Kocbach, on the basis of this document (origin: David Carlisle, Manchester University)File A.tex contains all necessary code This file is prepared by running l转载 2015-02-14 17:06:16 · 15596 阅读 · 1 评论 -
杂谈:如何调试CUDA代码
刚刚找到很隐蔽的一个bug(^-^),趁大脑还清醒赶紧滚过来写一下感想,如果对读者有一点点的帮助,那就是再好不过的事情了!CUDA并行编程复杂,相比CPU单线程,主要有三点:第一,CUDA程序开发难,一方面要根据串行算法设计并行化算法,这要求有很好的算法基础,另一方面还要了解GPU底层硬件以更好地利用CUDA模型,这还要求一些硬件架构基础;第二,CUDA程序调试难,相比单线程开发,CUDA多线原创 2015-03-26 21:09:38 · 5001 阅读 · 0 评论 -
ubuntu下 双显卡Optimus笔记本 CUDA配置教程(成功解决黑屏问题)
Intel出于笔记本独显发热量大的考虑开发了Optimus技术,在Ubuntu平台上,实际上集显负责二维渲染,独显负责三维渲染。(这里我们要明确一个问题,intel的核芯显卡HD系列负责我们桌面的显示!)现在的CUDA SDK包含了Nvidia Driver Cuda Drive以及CUDA Samples共三个方面的内容,这里强烈推荐使用CUDA SDK包内的Nvidia驱动,否则容易出现显原创 2015-04-13 09:52:36 · 5800 阅读 · 5 评论