深度学习

如何理解卷积? 卷积的物理意义是:一个函数(如:单位响应)在另一个函数(如:输入信号)上的加权叠加。对于线性时不变系统,如果知道该系统的单位响应,那么将单位响应和输入信号求卷积,就相当于把输入信号的各个时间点的单位响应加权叠加,就直接得到了输出信号。在信号与系统中,卷积就是计算线性时...

2017-03-13 09:02:26

阅读数 246

评论数 0

Linux下安装opencv cmake 命令

cmake -D CMAKE_BUILD_TYPE=RELEASE -D CMAKE_INSTALL_PREFIX=./build -D  WITH_IPP=OFF -D WITH_CUDA=OFF ../opencv-3.0.0

2017-02-28 18:44:32

阅读数 285

评论数 0

CUDA任意矩阵相乘 TLP最终版

#include #include #include #include #include #include #include "device_launch_parameters.h" //#include "common.h" u...

2016-03-21 15:51:11

阅读数 488

评论数 0

对CUDA内核函数运行时间测量的方法

方法1: cudaEvent_t start1; cudaEventCreate(&start1); cudaEvent_t stop1; cudaEventCreate(&stop1); cudaEventRecord(start1, NULL); 需要测时间的内核函...

2016-03-16 14:11:03

阅读数 708

评论数 0

显卡显存带宽的计算

bus width 是显存位宽 bandwidth 才是带宽 带宽(Bytes/s)=位宽(bit)x显存有效频率(Hz)/8 公式:显存位宽 X显存频率(GD3X2 ,GD5要X4)再除以8就是显存带宽。 显存有效频率=显存基本频率X显存类型(DDR3的乘以2,DDR5的乘以...

2016-03-15 10:14:17

阅读数 681

评论数 0

有关FLOPS的定义与计算

FLOPS(即“每秒浮点运算次数”,“每秒峰值速度”),是“每秒所执行的浮点运算次数”(floating-point operations per second)的缩写。它常被用来估算电脑的执行效能,尤其是在使用到大量浮点运算的科学计算领域中。正因为FLOPS字尾的那个S,代表秒,而不是复数,所...

2016-03-14 22:28:41

阅读数 10688

评论数 0

移除VS2005方案中的Visual SourceSafe绑定信息

有些一个解决方案带有多个项目,由于代码比较多,多人开发,所以好多vs.net下的工程是用source safe进行版本控制的。而用source safe进行版本控制需要局域网路径共享,因此好多项目换一台机器打开会出现一些问题,比如“解决方案看起来是受源代码管理,但无法找到它的绑定信 息……”之类的...

2015-10-10 10:56:19

阅读数 292

评论数 0

CUDA在Windows下的软件开发环境搭建

CUDA在Windows下的软件开发环境搭建  本文我们以Visual Studio 2005 为例演示CUDA的安装以及软件开发环境搭建,以及CUDA与MFC联调的实现。 1.cuda安装包 CUDA是免费使用的,各种操作系统下的CUDA安装包均可以在http://www.nv...

2015-10-09 22:57:26

阅读数 293

评论数 0

CUDA开发环境配置大全

一、操作系统: (1)windows操作系统: 1.windows xp: (1)       win32_xp_ CUDA3.0_VS2010_配置指南-DOC: http://cudabbs.it168.com/forum.php?mod=viewthr...

2015-10-09 20:23:11

阅读数 255

评论数 0

[综合面试] 面试70问 经典回答

1、请你自我介绍一下你自己,   回答提示:一般人回答这个问题过于平常,只说姓名、年龄、爱好、工作经验,这些在简历上都有,其实,企业最希望知道的是求职者能否胜任工作,包括:最强的技能、最深入研究的知识领域、个性中最积极的部分、做过的最成功的事,主要的成就等,这些都可以和学习无关,也可以和学习有关...

2015-10-09 11:09:40

阅读数 384

评论数 0

[综合面试] 牛人整理分享的面试知识:操作系统、计算机网络、设计模式、Linux编程,数据结构总结

一:操作系统 1. 进程的有哪几种状态,状态转换图,及导致转换的事件。 2. 进程与线程的区别。 3. 进程通信的几种方式。 4. 线程同步几种方式。(一定要会写生产者、消费者问题,完全消化理解) 5. 线程的实现方式. (也就是用户线程与内核线程的区别) 6....

2015-10-09 11:08:47

阅读数 317

评论数 0

CUDA中Bank conflict冲突

其实这两天一直不知道什么叫bank conflict冲突,这两天因为要看那个矩阵转置优化的问题,里面有讲到这些问题,但是没办法,为了要看懂那个bank conflict冲突,我不得不去找资料,说句实话我现在不是完全弄明白,但是应该说有点眉目了,现在我就把网上找的整理一下,放在这边,等哪天完全弄明白...

2015-09-28 16:07:09

阅读数 252

评论数 0

在 Visual Studio 中使用 CUDA

CUDA 的主要工具是 nvcc,它会执行所需要的程序,将 CUDA 程序代码编译成执行档 (或 object 檔) 。在 Visual Studio 下,我们透过设定 custom build tool 的方式,让 Visual Studio 会自动执行 nvcc。 这里以 Visual ...

2015-09-28 10:40:18

阅读数 730

评论数 0

利用CUDA的矩阵乘法1 <利用 Kahan's Summation Formula 来提高CUDA 的浮点数运算精确度>

//矩阵乘法 #include #include #include #include #include   #define NUM_THREADS 256   bool InitCUDA() {    int count;  ...

2015-09-24 13:36:54

阅读数 303

评论数 0

CUDA编程常见问题

最近初试cuda编程,作为一个新手,遇到了各种各样的问题,然后花费了大量时间解决这些匪夷所思的问题。为了避免后来人重蹈覆辙,现把自己遇到的问题总结如下。 (一)  cudaMalloc      初次使用该函数,感觉没有什么困难,和c语言的malloc类似。但是在具体应用中却出了一个很...

2015-09-24 13:36:01

阅读数 246

评论数 0

CUDA 图像数据结构

CudaImage.h struct CudaImage { int width; int height; float *imData; float *cuData; size_t pitch; size_t nBytes; void setPixel(int x, int y, ...

2015-09-24 13:34:41

阅读数 543

评论数 0

解决CUDA程序的黑屏恢复问题

问题描述: 在运行CUDA程序时,出现黑屏,过一会儿屏幕恢复之后,出现如下界面: ============================================================================== 解决方案:  调整计算机的TDR值   ...

2015-09-24 13:32:09

阅读数 1806

评论数 0

CUDA 类型转化

类型转换函数,函数命名格式记住,左边两个下划线,右边一个,中间是类型转换的描述,如__int2float_。   主要好处在于它的选项,其实大多数情况下,使用c内置的自动转换就可以了(相比java,c的方式不太安全,因此使用时还是应该注意溢出)。 选项如下: rn:求最近的偶数,问题:5为...

2015-09-24 13:31:09

阅读数 670

评论数 0

浅谈CUDA零拷贝内存

今天看到有小伙伴提出了“零拷贝”的问题,由于本人以前用的也比较少,了解不多,因此打算好好研究一番,现做些总结。         零拷贝内存是一种特殊形式的内存映射,它允许你将主机内存直接映射到GPU内存空间。因此,因此对GPU上的内存解引用时,如果是基于GPU的,那么就获得全局内存的高速带宽;如...

2015-09-24 13:10:21

阅读数 2232

评论数 0

error C2664: “LoadLibraryW”: 不能将参数 1 从“const char *”转换为“LPCWSTR”

1 静态调用DLL Project | setting  Link选项卡Library modules处 添加“XXX.lib” 然后#include "XXX.h" 把XXX.lib(引入库文件),XXX.DLL(动态库文件) XXX.h(头文件) 全部放到工程...

2015-09-23 11:27:25

阅读数 421

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭