niefeng111-CSDN博客

原创测试求和 waiting

#include "h.h"#include "cuda_runtime.h"#include "device_launch_parameters.h"//测试求和不正确？？__global__ static void ComputeFeature1( int *sum1,int* pdMatrix,int width,int height,float *g_f1) //186ye{//pdMa

2014-04-21 21:45:49 448

原创 grid block分配与原子加

#define W 12#define H 4__global__ void addKernel( int **c){int tid_in_x,tid_in_y;tid_in_x=blockIdx.x*blockDim.x+threadIdx.x;tid_in_y=blockIdx.y*blockDim.y+threadIdx.y;int tid;// ti

2014-04-03 17:34:10 668

转载 CUDA编程接口:异步并发执行的概念和API

转载自IT168：http://cuda.it168.com/a2011/1215/1289/000001289321.shtml【IT168技术】本文主要描述了支持系统中不同层次的异步并发执行的概念和API。　　相关阅读：　　CUDA编程接口：分页锁定主机存储器　　CUDA编程接口：共享存储器实现矩阵相乘　　CUDA编程接口：运行初始化与设备存储器　　CUDA编程接口：使

2014-03-31 21:46:09 982

转载 c语言二维数组定义域动态分配空间

c语言二维数组定义域动态分配空间在定义数组时，会经常涉及到二维数组的定义。而当数组初始大小为动态时，我们就需要动态的为数组分配空间。分配空间的函数为malloc()或者calloc()。calloc()跟malloc()的区别在于calloc在动态分配完内存后，自动初始化该内存空间为零，而malloc不初始化，里边数据是随机的垃圾数据。并且malloc申请的内存可以是不连续的，而cal

2014-03-13 22:43:18 1271 2

原创项目计划 me1

per_three_days_planning1）1.找灰度共生阶梯矩阵的c代码，完善。2.完善灰度共生矩阵算法代码。3.用已有的切割出来的照片为数据，调试上述得到的代码。2）如果此时已经完成代码部分，则进入GPU学习。如果此时未完成代码部分，则继续finish 代码部分。3）1.在自己笔记本中安装CUDA。2.通过GPU、CUDA相关书籍（暂定《GPU 高

2014-03-13 22:39:29 713

转载 matlab 计算运行时间三种方式

经常我们需要计算我们程序到底运行多长时间，这样可以比较程序的执行效率。当然这个对于只有几秒钟的小程序没有什么意义，但是对于大程序就有很重要的意义了。下面我们就说说Matlab中计算程序运行时间的三种常用方法吧！注意：三种方法由于使用原理不一样，得到结果可能有一定的差距！ 1、tic和toc组合(使用最多的) 计算tic和toc之间那段程序之间的运行时间，它的经典格式为

2014-03-13 22:36:24 1172

原创项目笔记--图像处理

8.13http://blog.163.com/cumt_xl/blog/static/1907150442012765348460/当 Visual C++ 项目启用了预编译头 (Precompiled header) 功能时，如果项目中同时混合有 .c 和 .cpp 源文件，则可能收到 C1853 编译器错误：fatal error C1853: 'pjtname.pch' preco

2014-03-13 22:28:50 932

转载束表决函数作用

warp vote是2.0+的一个特性，用来在warp内交换1-bit的信息的。有三种，一种是直接将32个1-bit的位，映射成1个32位整数。warp中的线程0，将占据这个映射结果的最低0位，线程1占据这结果的次低位，线程31占据这个32位整数结果的最高位。将这个结果复制32份，每个线程都将得到一份。其他两种是这个操作的扩展，一个是and操作，将这个结果的32个bit，进行and,

2014-03-13 17:53:04 1093