Texture Memory
作为图形世界里的一个特征,纹理是在多边形上拉伸、旋转和粘贴的图像,以形成我们熟悉的3D图形。而在GPU计算中使用纹理内存是对CUDA程序员的进阶建议,纹理内存允许像数组一样随机访问并且通过cache提高带宽。
总体来说,CUDA提供了两套不同的API访问纹理内存:
- texture reference API(支持所有设备)
- texture object API(仅支持capacity ≥ 3. x \ge3.\text x ≥3.x )
PS:texture reference
在CUDA 5.0后已被弃用,但考虑到很多历史代码仍然使用并且理解了texture reference
后可以快速上手texture object
,所以本文一并介绍
设备执行kernel时,通过Texture Functions(显然属于device functions)访问纹理内存,引出一个称呼texture fetch
——调用texture function之一访问纹理内存的过程。
每一个texture fetch
都规定了一个参数texture object
(如果使用texture object API)或texture reference
(如果使用texture reference API)
texture object / texture reference
-
texture
:希望访问的一段纹理内存,可以是设备中一段线性内存或是一个CUDA数组texture object
:运行时创建,texture
在其创建时也随之指定texture reference
:编译时创建,通过运行时绑定texture reference
到某段纹理内存完成texture
的指定;不同的texture reference
可以绑定到相同texture
或是内存有重叠的texture
-
dimensionality
:定义texture
的维度,将texture
看作一维、二维或三维数组。texels
:texture elements的简称,即数组中的元素texture width & texture height & texture depth
:数组各维度的大小
-
type
:texel
的类型,只能为以下几种类型-
基本整数类型(8位、16位、32位和64位整型)
-
单精度浮点数类型
-
由基本整型和单精度度浮点数生成的内置向量类型,且组件个数只能为1、2和4
PS:内置向量类型实际为结构体,CUDA允许其有2、3和4个成员,并且通过
x
,y
,z
和w
分别访问第一,第二,第三和第四个成员;构造函数形如make_<type name>
,例如int2 make_int2(int x, int y)
生成一个int2
类型的值(x,y)
。详细用法参见官方文档Built-in Vector Types
-
-
read mode
:读数据模式cudaReadModeElementType
:不发生转换cudaReadModeNormalizedFloat
:当type
为16-bit或8-bit整数(short/ushort
或char/uchar
,i.e.不适用于32位整数)时,texture fetch
返回的值均匀地映射为 [ 0.0 , 1.0 ] [0.0, 1.0] [0.0,1.0](对于无符号类型,i.e.ushort/uchar
)或 [ − 1.0 , 1.0 ] [-1.0, 1.0] [−1.0,1.0](对于有符号数,i.e.short/char
)中的浮点数
-
是否标准化
texture
坐标- 非标准化坐标: [ 0 , N − 1 ] [0, N-1] [0,<