共享内存、文理内存是cuda中经常用到的内存模式。
一、共享内存和同步:
、共享内存和同步:实现方式:__share__ float array[N]; N一般为threadsPerBlock。
N的确定方式之一:对于共享内存来说,由于编译器将为每个线程块生成共享变量的一个副本,因此,只需根据线程块中线程的数量来分配内存。
实用情形:
二、纹理内存(只读):
1、一维纹理内存的使用(必须先把数据cudaMemcpy到设备上,然后把设备上的该数据绑定到纹理内存,见文档尾示例):
定义: texture <float> texIn;
texture <float,1, cudaReadModeElementType> texIn;
绑定: cudaBindTexture(NULL,texIn,hostDataPtr,host