![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
c
36ICE
这个作者很懒,什么都没留下…
展开
-
CUDA学习——BMP文件格式
现在开始学习有关数字图像处理部分,首先接触的是BMP图像。 刚开始以为很多有关图像格式的定义需要自己来完成,后来才知道,这些已经被包含在内库中了,感觉比较方便。 首先介绍一下BMP图像的文件格式: 位图文件头->文图信息头->彩色表->位图数据。 以下源代码是《数字图像处理实训教程》中有关raw数据到bmp格式的转换,转载 2015-12-13 21:53:33 · 669 阅读 · 0 评论 -
CUDA学习——CUDA代码常用编写技巧(转)
1. 声明 __shared__ 变量或数组: __shared__ float sh_farr[ 256]; __shared__ int a; 2.结构体指针成员的分配设备内存: typedef struct Teacher_t ...{ int a; unsigned int *g_mem1; float *g_me转载 2015-12-13 21:55:02 · 358 阅读 · 0 评论 -
CUDA学习—cudaMallocArray()
名称: cudaMemcpyToArray – 在主机和设备间复制数据 概要: cudaError_t cudaMemcpyToArray(struct cudaArray* dstArray,size_t dstX,size_t dstY,const void* src,size_t count,enum cudaMemcpyKind kind) cudaError_t cud转载 2015-12-13 21:56:54 · 1278 阅读 · 0 评论 -
cudaMallocPitch()使用
名称 cudaMallocPitch – 向GPU分配存储器 概要 cudaError_t cudaMallocPitch( void** devPtr,size_t* pitch,size_t widthInBytes,size_t height ) 说明 向设备分配至少widthInBytes*height字节的线性存储器,并以*devPtr的形式返回指向所分配存储器的指针。该函数转载 2015-12-13 21:57:41 · 1074 阅读 · 0 评论 -
【内存对齐(一)】#pragma pack的用法及大小的计算(转)
【内存对齐(一)】#pragma pack的用法及大小的计算 现在的一些处理器,需要你的数据的内存地址必须是对齐(align)的,即使不是必须,如果你对齐的话,运行的速度也会得到提升。虽然对齐会产生的额外内存空间,但相对于这个速度的提升来说,是值得的。 所谓对齐,就是地址必须能整除一个整数,这个就是对齐参数(alignment value)。合法的取值范围是1、2、4、6、16、……、81转载 2015-12-13 21:59:17 · 229 阅读 · 0 评论