CUDA纹理内存入门详解

最新推荐文章于 2024-09-21 16:26:46 发布

YCoder110

最新推荐文章于 2024-09-21 16:26:46 发布

阅读量3.1k

点赞数 4

文章标签： c++

本文链接：https://blog.csdn.net/hgkjbm/article/details/123868696

版权

本文深入介绍了CUDA的纹理内存，包括Texture Object和Texture Reference的使用。内容涵盖纹理内存的作用、API访问方式、纹理描述符、资源描述符、过滤模式和标准化坐标等关键概念，同时提供了示例代码，帮助理解纹理内存如何在GPU计算中提高带宽和效率。

摘要由CSDN通过智能技术生成

Texture Memory

作为图形世界里的一个特征，纹理是在多边形上拉伸、旋转和粘贴的图像，以形成我们熟悉的3D图形。而在GPU计算中使用纹理内存是对CUDA程序员的进阶建议，纹理内存允许像数组一样随机访问并且通过cache提高带宽。

总体来说，CUDA提供了两套不同的API访问纹理内存：

texture reference API（支持所有设备）
texture object API（仅支持capacity $\ge3.\text x$ ）

PS：texture reference在CUDA 5.0后已被弃用，但考虑到很多历史代码仍然使用并且理解了texture reference后可以快速上手texture object，所以本文一并介绍

设备执行kernel时，通过Texture Functions（显然属于device functions）访问纹理内存，引出一个称呼texture fetch——调用texture function之一访问纹理内存的过程。

每一个texture fetch都规定了一个参数texture object（如果使用texture object API）或texture reference（如果使用texture reference API）

texture object / texture reference

texture：希望访问的一段纹理内存，可以是设备中一段线性内存或是一个CUDA数组
- texture object：运行时创建，texture在其创建时也随之指定
- texture reference：编译时创建，通过运行时绑定texture reference到某段纹理内存完成texture的指定；不同的texture reference可以绑定到相同texture或是内存有重叠的texture
dimensionality：定义texture的维度，将texture看作一维、二维或三维数组。
- texels：texture elements的简称，即数组中的元素
- texture width & texture height & texture depth：数组各维度的大小
type：texel的类型，只能为以下几种类型
- 基本整数类型（8位、16位、32位和64位整型）
- 单精度浮点数类型
- 由基本整型和单精度度浮点数生成的内置向量类型，且组件个数只能为1、2和4
  
  PS：内置向量类型实际为结构体，CUDA允许其有2、3和4个成员，并且通过x，y，z和w分别访问第一，第二，第三和第四个成员；构造函数形如make_<type name>，例如int2 make_int2(int x, int y)生成一个int2类型的值(x,y)。
  
  详细用法参见官方文档Built-in Vector Types
read mode：读数据模式
- cudaReadModeElementType：不发生转换
- cudaReadModeNormalizedFloat：当type为16-bit或8-bit整数（short/ushort或char/uchar，i.e.不适用于32位整数）时，texture fetch返回的值均匀地映射为 $[0.0, 1.0]$ （对于无符号类型，i.e. ushort/uchar）或 $[- 1.0, 1.0]$ （对于有符号数，i.e. short/char）中的浮点数
是否标准化texture坐标
- 非标准化坐标： $[0, <$