c
36ICE
这个作者很懒,什么都没留下…
展开
-
CUDA学习——BMP文件格式
现在开始学习有关数字图像处理部分,首先接触的是BMP图像。 刚开始以为很多有关图像格式的定义需要自己来完成,后来才知道,这些已经被包含在内库中了,感觉比较方便。 首先介绍一下BMP图像的文件格式: 位图文件头->文图信息头->彩色表->位图数据。 以下源代码是《数字图像处理实训教程》中有关raw数据到bmp格式的转换,转载 2015-12-13 21:53:33 · 659 阅读 · 0 评论 -
CUDA学习——CUDA代码常用编写技巧(转)
1. 声明 __shared__ 变量或数组:__shared__ float sh_farr[ 256];__shared__ int a;2.结构体指针成员的分配设备内存:typedef struct Teacher_t...{ int a; unsigned int *g_mem1; float *g_me转载 2015-12-13 21:55:02 · 356 阅读 · 0 评论 -
CUDA学习—cudaMallocArray()
名称: cudaMemcpyToArray – 在主机和设备间复制数据概要: cudaError_t cudaMemcpyToArray(struct cudaArray* dstArray,size_t dstX,size_t dstY,const void* src,size_t count,enum cudaMemcpyKind kind) cudaError_t cud转载 2015-12-13 21:56:54 · 1272 阅读 · 0 评论 -
cudaMallocPitch()使用
名称 cudaMallocPitch – 向GPU分配存储器概要 cudaError_t cudaMallocPitch( void** devPtr,size_t* pitch,size_t widthInBytes,size_t height )说明 向设备分配至少widthInBytes*height字节的线性存储器,并以*devPtr的形式返回指向所分配存储器的指针。该函数转载 2015-12-13 21:57:41 · 1066 阅读 · 0 评论 -
【内存对齐(一)】#pragma pack的用法及大小的计算(转)
【内存对齐(一)】#pragma pack的用法及大小的计算现在的一些处理器,需要你的数据的内存地址必须是对齐(align)的,即使不是必须,如果你对齐的话,运行的速度也会得到提升。虽然对齐会产生的额外内存空间,但相对于这个速度的提升来说,是值得的。所谓对齐,就是地址必须能整除一个整数,这个就是对齐参数(alignment value)。合法的取值范围是1、2、4、6、16、……、81转载 2015-12-13 21:59:17 · 227 阅读 · 0 评论