- 博客(9)
- 资源 (11)
- 收藏
- 关注
原创 opencv+cuda内存泄露错误
在编写的模版中,利用opencv进行拷贝图像data时,报错如下:Unhandled exception at 0x74dec42d in XXXX_CUDA.exe: Microsoft C++ exception: cv::Exception at memory location 0x0017f878.定位到错误在:cvReleaseImage( ©_y );也就是说释放图像数据是时候,发生内存非法读写;template<class T>void grad_y( const IplI
2015-08-31 11:36:54 1826 2
原创 显卡的相关性能参数含义(struct cudaDeviceProp)
struct cudaDeviceProp {char name[256]; //器件的名字size_t totalGlobalMem; //Global Memory 的byte大小size_t sharedMemPerBlock; //线程块可以使用的共用记忆体的最大值。byte为单位,多处理器上的所有线程块可以同时共用这些记忆体int regsPerBlock; //线程块可以使用的32位寄存器的最大值,多处理器上的所有线程快可以同时实
2015-08-31 10:41:43 4837 1
转载 《GPU高性能编程CUDA实战》中代码整理
转自:点击打开链接CUDA架构专门为GPU计算设计了一种全新的模块,目的是减轻早期GPU计算中存在的一些限制,而正是这些限制使得之前的GPU在通用计算中没有得到广泛的应用。 使用CUDA C来编写代码的前提条件包括:(1)、支持CUDA的图形处理器,即由NVIDIA推出的GPU显卡,要求显存超过256MB;(2)、NVIDIA设备驱动程序,用于实现应用程序与支持CUDA的硬件之间的
2015-08-31 10:38:16 1553
原创 数值分析--矩阵QR分解的三种方法
QR分解法是目前求一般矩阵全部特征值的最有效并广泛应用的方法,一般矩阵先经过正交相似变化成为Hessenberg矩阵,然后再应用QR方法求特征值和特征向量。它是将矩阵分解成一个正规正交矩阵Q与上三角形矩阵R,所以称为QR分解法,与此正规正交矩阵的通用符号Q有关。
2015-08-27 10:33:26 24482
原创 编译器? 求解两数运算?
这个问题也不算新鲜了,换一种方式提问就是"如何不用 + - * / 运算符,来求解两元素之和"的问题;大家很自然的回想起利用位运算。在数字电路中,我们都遇到过设计“加法器”的问题,利用位与、或、非、异或可以很轻松的解决此问题;这里,不用此方式,而是借助编译器的地址偏移,来解决问题。基本思路如下:(1)将其中int型数据转为地址(或者说是一个数组的首地址)(2)然后利用数组下角标索引,进行地址偏移,获取偏移后的address(3)将(2)中得到的地址转换为int类型下面贴出code,几行的事儿,但可
2015-08-26 10:50:28 981
原创 变量在内存中的存储方式-----“大端”和“小端”
“大端”和“小端”可以追溯到1726年的Jonathan Swift的《格列佛游记》,其中一篇讲到有两个国家因为吃鸡蛋究竟是先打破较大的一端还是先打破较小的一端而争执不休,甚至爆发了战争。1981年10月,Danny Cohen的文章《论圣战以及对和平的祈祷》(On holy wars and a plea for peace)将这一对词语引入了计算机界(《程序设计实践》第9章)。这么看来,所谓大端和小端,也就是big-endian和little-endian,其实是从描述鸡蛋的部位而引申到计算机地址的描述
2015-08-25 19:16:44 4272
原创 如何高效存储稀疏矩阵?
为了节省存储空间并且加快并行程序处理速度,需要对稀疏矩阵进行压缩存储,压缩存储的原则是:不重复存储相同元素;不存储零值元素。常用的几种矩阵的存储格式如下:COO,CSR,DIA,ELL,HYB等;稀疏矩阵是指矩阵中的元素大部分是0的矩阵,事实上,实际问题中大规模矩阵基本上都是稀疏矩阵,很多稀疏度在90%甚至99%以上。因此我们需要有高效的稀疏矩阵存储格式。本文总结几种典型的格式:COO,CSR,D
2015-08-12 01:04:15 9116 1
转载 __declspec(dllexport)
先看代码:以下是在dev-c++里建立自已的dll时的dll.h里面的代码,这里面有一个:_declspec(dllexport)#ifndef _DLL_H_#define _DLL_H_//防重复定义#if BUILDING_DLL# define DLLIMPORT __declspec (dllexport)#else# define DLLIMPORT __declspec (dllim
2015-08-11 15:49:22 805
原创 Intel Threading BuildingBlocks(Intel TBB)介绍
Intel Threading BuildingBlocks(Intel TBB)是一个使用ISO C++代码实现的多平台、可扩展并行编程库。下边首先给出一个免费版本的TBB下载链接:打开链接(1)what's Intel Threading BuildingBlocks(Intel TBB)? The Intel® Threading Building Blocks (Intel® TBB) library provides software developers with a s
2015-08-05 14:42:09 1545
MobaXterm工具
2016-10-23
编译工具cmake(cmake-3.6.1-win64-x64)
2016-08-24
Game Engine Architecture(中英两版本)
2015-05-26
OpenGL实现离屏渲染(Offscreen Render),
2014-12-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人