- 博客(8)
- 资源 (7)
- 问答 (1)
- 收藏
- 关注
原创 测试求和 waiting
#include "h.h"#include "cuda_runtime.h"#include "device_launch_parameters.h"//测试求和 不正确??__global__ static void ComputeFeature1( int *sum1,int* pdMatrix,int width,int height,float *g_f1) //186ye{//pdMa
2014-04-21 21:45:49 448
原创 grid block分配与原子加
#define W 12#define H 4__global__ void addKernel( int **c){int tid_in_x,tid_in_y;tid_in_x=blockIdx.x*blockDim.x+threadIdx.x;tid_in_y=blockIdx.y*blockDim.y+threadIdx.y;int tid;// ti
2014-04-03 17:34:10 668
转载 CUDA编程接口:异步并发执行的概念和API
转载自IT168:http://cuda.it168.com/a2011/1215/1289/000001289321.shtml【IT168技术】本文主要描述了支持系统中不同层次的异步并发执行的概念和API。 相关阅读: CUDA编程接口:分页锁定主机存储器 CUDA编程接口:共享存储器实现矩阵相乘 CUDA编程接口:运行初始化与设备存储器 CUDA编程接口:使
2014-03-31 21:46:09 982
转载 c语言二维数组定义域动态分配空间
c语言二维数组定义域动态分配空间 在定义数组时,会经常涉及到二维数组的定义。而当数组初始大小为动态时,我们就需要动态的为数组分配空间。分配空间的函数为malloc()或者calloc()。calloc()跟malloc()的区别在于calloc在动态分配完内存后,自动初始化该内存空间为零,而malloc不初始化,里边数据是随机的垃圾数据。并且malloc申请的内存可以是不连续的,而cal
2014-03-13 22:43:18 1271 2
原创 项目计划 me1
per_three_days_planning1)1.找灰度共生阶梯矩阵的c代码,完善。2.完善灰度共生矩阵算法代码。3.用已有的切割出来的照片为数据,调试上述得到的代码。2)如果此时已经完成代码部分,则进入GPU学习。如果此时未完成代码部分,则继续finish 代码部分。3)1.在自己笔记本中安装CUDA。2.通过GPU、CUDA相关书籍(暂定《GPU 高
2014-03-13 22:39:29 713
转载 matlab 计算运行时间三种方式
经常我们需要计算我们程序到底运行多长时间,这样可以比较程序的执行效率。当然这个对于只有几秒钟的小程序没有什么意义,但是对于大程序就有很重要的意义了。 下面我们就说说Matlab中计算程序运行时间的三种常用方法吧! 注意:三种方法由于使用原理不一样,得到结果可能有一定的差距! 1、tic和toc组合(使用最多的) 计算tic和toc之间那段程序之间的运行时间,它的经典格式为
2014-03-13 22:36:24 1172
原创 项目笔记--图像处理
8.13http://blog.163.com/cumt_xl/blog/static/1907150442012765348460/当 Visual C++ 项目启用了预编译头 (Precompiled header) 功能时,如果项目中同时混合有 .c 和 .cpp 源文件,则可能收到 C1853 编译器错误:fatal error C1853: 'pjtname.pch' preco
2014-03-13 22:28:50 932
转载 束表决函数作用
warp vote是2.0+的一个特性,用来在warp内交换1-bit的信息的。有三种,一种是直接将32个1-bit的位,映射成1个32位整数。warp中的线程0,将占据这个映射结果的最低0位,线程1占据这结果的次低位,线程31占据这个32位整数结果的最高位。将这个结果复制32份,每个线程都将得到一份。其他两种是这个操作的扩展,一个是and操作,将这个结果的32个bit,进行and,
2014-03-13 17:53:04 1093
cuda 原子和的第二个参数问题
2014-04-24
TA创建的收藏夹 TA关注的收藏夹
TA关注的人