- 博客(20)
- 资源 (10)
- 收藏
- 关注
原创 CUDA sample源码分析,dct8*8
学习共享内存+纹理内存的使用方法dct8*8.cufloat WrapperCUDA1(byte *ImgSrc, byte *ImgDst, int Stride, ROI Size){ //prepare channel format descriptor for passing texture into kernels cudaChannelFormatDesc floatt
2016-12-28 14:41:27 1307
原创 引用计数
浅拷贝下的对象资源回收: 每次对象被析构后,引用计数减一; 只有当引用计数为0时才允许进行内存释放,大于0时不执行内存释放操作; 引用计数需要定义为指针变量,为了在不同对象之间传递,该指针由最后一个对象释放。
2016-12-27 17:36:07 821
原创 CUDA总结:opencv图像金字塔函数分析
基于 opencv 3.1.0相关源码 ..\sources\modules\cudalegacy\src\image_pyramid.cpp ..\sources\modules\cudalegacy\src\cuda\NCVPyramid.cu类 cv::cuda::ImagePyramidImpl金字塔分解,调用层次: cv::cuda::ImagePyramidImpl::Imag
2016-12-26 17:46:47 1648
原创 CUDA总结:opencv cuda模块高斯滤波函数分析
基于opencv 3.1相关接口cv::Ptr<cv::cuda::Filter> // 滤波器对象指针,位于opencv2\cudafilters.hppcv::cuda::createGaussianFilter // 创建高斯滤波器对象,位于opencv2\cudafilters.hppcv::cuda::Filter::apply // 滤波器实现,位于
2016-12-22 21:56:16 5066
原创 命令行(批处理)设置环境变量
主要为了方便设置第三方库的可执行目录,不需要每次都进入系统设置里面输入rem 添加环境变量rem 添加系统环境变量wmic ENVIRONMENT create name="MyVar",username="<system>",VariableValue="MyValue"rem 添加用户环境变量wmic ENVIRONMENT create name="MyVar",username="%U
2016-12-15 16:17:39 881
原创 解决opencv310 ffmpeg、ippicv_windows_20151201.zip无法下载问题
ffmpeg文件无法下载CMake错误CMake Warning at cmake/OpenCVUtils.cmake:872 (message): Download: Local copy of opencv_ffmpeg.dll has invalid MD5 hash: 3a56b0b26c0d56457a990eb00d87f889 (expected: 89c783eee1c4
2016-12-14 10:48:02 14064 17
原创 CUDA总结:合并访问coalesced
传输延迟(latency)在host端和device端之间存在latency,数据通过PCI-E总线从CPU传输给GPU,我们必须避免 频繁的host、device间数据传输,即使是最新的PCIE 3.0 x16接口,其双向带宽也只有32GB/s在device内部也存在latency,即数据从gpu的存储器到multi-processor(SM)的传输。 访问一次全局内存,将耗费400~60
2016-12-12 23:03:12 10350 1
原创 CUDA总结:线程网络和线程分配
线程网络cuda将线程抽象为grid、block、thread三个层次,构成两种视图:视图1:一个device就是一个grid,grid的最小元素是block,一个grid由若干个block组成。 cuda通过一个dim3的变量描述一个grid里面的block的排列方式。一个grid可以是一维、二维、三维矩阵。struct __device_builtin__ dim3{ unsigne
2016-12-12 21:55:15 6083
原创 cuda优化相关参数总结
根据《developer guide》所述, 寄存器:8TB/s 共享内存:1.5TB/s 纹理内存、常量内存、全局内存:200GB/s 注:以上全部基于Femi架构显存带宽Femi架构 “NVIDIA’s Next Generation CUDA Compute Architecture: Fermi”Kepler架构 “NVIDIA Kepler GK110 Architectur
2016-12-09 17:46:36 532
原创 Round操作
浮点数转整型说明参考:MSDNround up Adds 5e-n to the number being rounded, where n is the number of fractional digits in the number. 向上取整round down Subtracts 5e-n from the number being rounded, where n is the n
2016-12-08 17:22:11 1148
原创 vs编译cuda工程为DLL
平台:vs2012,x64,cuda 8.0vs中创建动态链接库项目项目属性-生成自定义-勾选CUDA 8.0项目属性-“CUDA C/C++”-“CUDA Runtime”-选择cuda运行时库的链接方式,动态or静态;“Target machine platform”-选择x64项目属性-“链接器”-“系统”-“子系统”-选择“本机(/SUBSYSTEM/NATIVE)”编码,编译异
2016-12-08 12:39:04 2098
原创 cudart.dll(cuda运行库)所在目录
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin,存放dll文件 \include,cpp的头文件 \lib,存放lib文件发布应用程序时,如果开发时调用的是cuda动态库,则需要拷贝该目录下相应的dll文件
2016-12-08 11:37:14 3321
原创 DLL的生命期
对于隐式调用,是进程的整个运行期;对于显式调用,是LoadLibrary和FreeLibrary之间。验证方法,查看进程何时进入DllMain中的DLL_PROCESS_DETACH分支附:DllMain各分支的含义:BOOL WINAPI DLLMain(HINSTANCE hinstDLL,DWORD fdwReason,LPVOID fImpLoad){ Switch(fdwReaso
2016-12-07 15:41:00 865
转载 vs中添加预处理宏的方法
VS中添加预处理宏的方法: 除了在.c及.h中添加宏定义之外,还可以采用如下方法添加宏定义: 1、若只需要定义一个宏(如#define DEBUG),可以右键点击工程–>属性–>c/c++–>预处理器–>预处理器定义,点击下拉框中的编辑,输入想要定义的宏; 2、如果还需要定义宏的内容(如#define inline __inline),可以右键点击工程–>属性–>c/c++–>命令行,在其它选
2016-12-07 14:04:39 4393 2
翻译 CUDA总结:同步
from cuda runtime api -2.API synchronization behavior The API provides memcpy/memset functions in both synchronous and asynchronous forms, the latter having an “Async” suffix. This is a misnomer as ea
2016-12-06 14:55:18 1348
原创 C数据类型相关问题
字节数char 1 short 2 int 由平台(编译器)决定,可能是2或4,通过sizeof获知 long 由平台(编译器)决定,可能是4或8 float 4 double 8 char*/float* /… x86,4字节,x64,8字节 数据范围(signed)char (1字节) -128——127 unsigned char 0——255 (signe
2016-12-05 13:35:49 642
原创 CUDA编译报错
error LNK2019: 无法解析的外部符号 cudaGetDeviceProperties附加依赖项-添加 cudart.lib
2016-12-02 22:32:08 1626
原创 内存频率与带宽
参考:http://tech.hexun.com/2010-12-09/126069181.html http://blog.chinaunix.net/uid-14214482-id-3220464.html内存带宽计算公式:带宽=内存核心频率×倍增系数×(内存总线位数/8) (通用的计算公式:带宽=频率*位宽/8)内存从SDRAM发展至今DDR4,其改变如下: (1)DDR采用时钟脉冲上升
2016-12-01 22:22:22 18332
VS2010运行库(包括mfc)
2016-09-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人