- 博客(4)
- 资源 (3)
- 收藏
- 关注
原创 【CUDA】三、存储器层级结构及共享存储器
一、存储器简介 对于CUDA线程,主要设置的存储器有:局部存储器、共享存储器、全局存储器、只读存储器。 局部存储器:作用域在每个线程的内部,每个线程都有一个自己私有的存储器; 共享存储器:作用域在线程块内,相同块内的线程可访问该存储中的数据,已达到数据共享; 全局存储器:比共享存储器的作用域更大,所有块中的线程都可用访
2015-12-20 21:45:30 1331
原创 【CUDA】二、内存分配函数
除了前面提到的内存分配函数cudaMalloc之外,这里再简单的介绍几个常用的内存分配函数:cudaMallocPitch、cudaMalloc3D等。1、cudaMallocPitchcudaError_t cudaMallocPitch(void **devPtr, size_t *pitch, size_t width, size_t height); 该函数用来分配
2015-12-12 22:48:21 4261 1
转载 VC 运行时库 /MD、/MDd 和 /MT、/MTd
原文地址:http://qimo601.iteye.com/blog/1550348这里总结下他们的区别,后面的那个'd'是代表DEBUG版本,没有'd'的就是RELEASE版本了。首先说/MT/MT是 "multithread, static version ” 意思是多线程静态的版本,定义了它后,编译器把LIBCMT.lib 安置到OBJ文件中,让链接器使用
2015-12-09 12:40:54 531
原创 【CUDA】第一个CUDA程序-addVector
本文主要通过对两个浮点数组中的数据进行相加,并将其结果放入第三个数组中。其算法分别在CPU、GPU上分别执行,并比较了所需时间,强烈感受到GPU的并行计算能力。这里,每个数组的元素大小为30000000个。一、实现代码#include <stdio.h>#include <stdlib.h>#include <time.h>#include <mat...
2015-12-05 21:38:33 2739 4
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人