一、学习目标
1.对 Direct3D 在规划调度 3D 硬件方面所起的作用有一个基本了解。
2.理解 COM 在 Direct3D 运行时起到的作用。
3.学习基本的绘图概念,比如 2D 图像的存储方式、页面翻转、深度缓存和多重采样。
二、Direct3D 概述
Direct3D 是一种底层绘图 API(application programming interface,应用程序接口), 它可以让我们可以通过 3D 硬件加速绘制 3D 世界。从本质上讲,Direct3D 提供的是一组软件接口,我们可以通过这组接口来控制绘图硬件。
例如,要命令绘图设备清空渲染目标(例如屏幕),我们可以调用 Direct3D 的ID3D11DeviceContext::ClearRenderTargetView 方法来完成这一工作。
Direct3D 层位于应用程序和绘图硬件之间,这样我们就不必担心 3D 硬件的 实现细节,只要设备支持 Direct3D11,我们就可以通过 Direct3D11API 来控制 3D 硬件了。
支持Direct3D 11的设备必须支持Direct3D11规定的整个功能集合以及少数的额外附加功能(有一些功能,比如多重采样数量,仍然需要以查询方式实现,这是因为不同的 Direct3D 硬件这个值可能并不一样)。
在 Direct3D 9 中,设备可以只支持 Direct3D 9 的部分功能;所以,当一个 Direct3D 9 应用程序要使用某一特性时,应用程序就必须先检查硬件是否支持该特性。如果要调用的是一个不为硬件支持Direct3D函数,那应用程序就会出错。 而在Direct3D 11 中,不需要再做这种设备功能检查,因为 Direct3D 11 强制要求设备实现 Direct3D 11 规定的所有功能特性。
三、COM
组件对象模型(COM)技术使 DirectX 独立于任何编程语言,并具有版本向后兼容的特性。
我们经常把 COM 对象称为接口,并把它当成一个普通的 C++类来使用。
当使用 C++ 编写 DirectX 程序时,许多 COM 的底层细节都不必考虑。
唯一需要知道的一件事情是,我们必须通过特定的函数或其他的COM接口方法来获取指向COM接口的指针,而不能用C++的 new 关键字来创建 COM 接口。
另外,当我们不再使用某个接口时,必须调用它的 Release 方法来释放它(所有的 COM 接口都继承于 IUnknown 接口,而 Release 方法是 IUnknown 接口的成员),而不能用 delete 语句——COM 对象在其自身内部实现所有的内存管理工作。 当然,有关 COM 的细节还有很多,但是在实际工作中只需知道上述内容就足以有效地使用 DirectX 了。 注意:COM 接口都以大写字母“I”为前缀。例如,表示 2D 纹理的接口为 ID3D11Texture2D。
四、纹理与资源格式
2D 纹理(texture)是一种数据元素矩阵。2D 纹理的用途之一是存储 2D 图像数据,在 纹理的每个元素中存储一个像素颜色。但这不是纹理的唯一用途;例如, 有种称为法线 贴图映射(normal mapping)的高级技术在纹理元素中存储的不是颜色,而是 3D 向量。因此,从通常意义上讲,纹理用来存储图像数据,但是在实际应用中纹理可以有更广泛的用途。
1D 纹理类似于一个 1D 数据元素数组,3D 纹理类似于一个 3D 数据元素数组。但是在随后 的章节中我们会讲到,纹理不仅仅是一个数据数组;纹理可以带有多级渐近纹理层(mipmap level), GPU 可以在纹理上执行特殊运算,比如使用过滤器(filter)和多重采样(multisampling)。 此外,不是任何类型的数据都能存储到纹理中的;
纹理只支持特定格式的数据存储,这些格 式由 DXGI_FORMAT 枚举类型描述。
一些常用的格式如下:
类型 | 含义 |
---|---|
DXGI_FORMAT_R32G32B32_FLOAT | 每个元素包含 3 个 32 位浮点分量 |
DXGI_FORMAT_R16G16B16A16_UNORM | 每个元素包含 4 个 16 位分量,分量 的取值范围在[0,1]区间内 |
DXGI_FORMAT_R32G32_UINT | 每个元素包含两个 32 位无符号整数分量 |
DXGI_FORMAT_R8G8B8A8_UNORM | 每个元素包含 4 个 8 位无符号分量,分 量的取值范围在[0,1]区间内 |
DXGI_FORMAT_R8G8B8A8_SNORM | 每个元素包含 4 个 8 位有符号分量,分 量的取值范围在[−1,1] 区间内 |
DXGI_FORMAT_R8G8B8A8_SINT | 每个元素包含 4 个 8 位有符号整数分量,分 量的取值范围在[−128,127] 区间内 |
DXGI_FORMAT_R8G8B8A8_UINT | 每个元素包含 4 个 8 位无符号整数分量,分 量的取值范围在[0,255]区间内 |
字母 R、G、B、A 分别表示 red(红)、green(绿)、blue(蓝)和 alpha(透明度)。每种颜色都是由红、绿、蓝三种基本颜色组成的(例如,黄色是由红色和绿色组成的)。 alpha 通道(或 alpha 分量)用于控制透明度。
不过,正如我们之前所述,纹理存储的不一 定是颜色信息;
例如,格式 DXGI_FORMAT_R32G32B32_FLOAT 包含 3 个浮点分量,可 以存储一个使用浮点坐标的 3D 向量。另外,还有一种弱类型(typeless)格式,可以预先 分配内存空间,然后在纹理绑定到管线时再指定如何重新解释数据内容(这一过程与 C++ 中的数据类型转换颇为相似);
例如,下面的弱类型格式为每个元素预留 4 个 8 位分量,且 不指定数据类型(例如:整数、浮点数、无符号整数): DXGI_FORMAT_R8G8B8A8_TYPELESS
五、交换链与页面反转
为了避免在动画中出现闪烁,最好的做法是在一个离屏(off-screen)纹理中执行所有的 动画帧绘制工作,这个离屏纹理称为后台缓冲区(back buffer)。
当我们在后台缓冲区中完 成给定帧的绘制工作后,便可以将后台缓冲区作为一个完整的帧显示在屏幕上;使用这种方 法,用户不会察觉到帧的绘制过程,只会看到完整的帧。
从理论上讲,将一帧显示到屏幕上 所消耗的时间小于屏幕的垂直刷新时间。硬件会自动维护两个内置的纹理缓冲区来实现这一功能,这两个缓冲区分别称为前台缓冲区(frontbuffer)和后台缓冲区。前台缓冲区存储了当前显示在屏幕上的图像数据,而动画的下一帧会在后台缓冲区中执行绘制。
当后台缓冲区的绘图工作完成之后,前后两个缓冲区的作用会发生翻转:后台缓冲区会变为前台缓冲区, 而前台缓冲区会变为后台缓冲区,为下一帧的绘制工作提前做准备。我们将前后缓冲区功能 互换的行为称做呈现(presenting)。提交是一个运行速度很快的操作,因为它只是将前台缓冲区的指针和后台缓冲区的指针做了一个简单的交换。下图说明了这一过程。
我们首先渲染缓冲区 B,它是当前的后台缓冲区。一旦帧渲染完成,前后缓冲 区的指针会相互交换,缓冲区 B 会变为前台缓冲区,而缓冲区 A 会变为新的后台缓冲区。 之后,我们将在缓冲区 A 中进行下一帧的渲染。一旦帧渲染完成,前后缓冲区的指针会再次进行交换,缓冲区 A 会变为前台缓冲区,而缓冲区 B 会再次变为后台缓冲区。
前 后 缓 冲 区 形 成 了 一 个 交 换 链 ( swap chain )。
在 Direct3D 中 , 交换链由 IDXGISwapChain 接口表示。该接口保存了前后缓冲区纹理,并提供了用于调整缓冲区尺寸的方法(IDXGISwapChain::ResizeBuffers)和呈现方法(IDXGISwapChain::Present)。
使用(前后)两个缓冲区称为双缓冲(double buffering)。缓冲区的数量可多于两个; 比如,当使用三个缓冲区时称为三缓冲(triple buffering)。不过,两个缓冲区已经足够用了。
六、深度缓冲与多重采样
深度缓冲区(depth buffer)是一个不包含图像数据的纹理对象。在一定程度上,深度 信息可以被认为是一种特殊的像素。常见的深度值范围在 0.0 到 1.0 之间,其中 0.0 表示离 观察者最近的物体,1.0 表示离观察者最远的物体。深度缓冲区中的每个元素与后台缓冲区 中的每个像素一一对应(即,后台缓冲区的第 ij 个元素对应于深度缓冲区的第 ij 个元素)。 所以,当后台缓冲区的分辨率为 1280×1024 时,在深度缓冲区中有 1280×1024 个深度元素。
为了说明深度缓存的工作方式,让我们来看一个例子。如下图所示,它展示的是观察 者看到的立体空间(左图)以及该立体空间的 2D 侧视图(右图)。从这个图中我们可以发 现,3 个不同的像素会被渲染到视图窗口的同一个像素点 P 上。(当然,我们知道只有最近 的像素会被渲染到 P 上,因为它挡住了后面的其他像素,可是计算机不知道这些事情。)首 先,在渲染之前,我们必须把后台缓冲区清空为一个默认颜色(比如黑色或白色),把深度 缓冲区清空为默认值——通常设为 1.0(像素所具有的最远深度值) 。
视图窗口相当于从 3D 场景生成的 2D 图像(后台缓冲区)。我们看到,有 3 个不同 的像素可以被投影到像素 P 上。直觉告诉我们,P1是 P 的最终颜色,因为它离观察者最近, 而且遮挡了其他两个像素。深度缓冲区算法提供了一种可以在计算机上实现的判定过程。 注意,我们所说的深度值是相对于观察坐标系而言的。实际上,当深度值存入深度缓冲区 时,它会被规范到[0.0,1.0]区间内。
现在,假设物体的渲染顺序依次为:圆柱体、球体和圆锥体。下面的表格汇总了在绘制 些物体时像素 P 及相关深度值的变化过程;其他像素的处理过程与之类似。
从上表可以看到,当我们发现某个像素具有更小的深度值时,就更新该像素以及它在深
度缓冲区中的相应深度值。通过一方式,在最终得到的渲染结果中只会包含那些离观察者最 近的像素。 综上所述,深度缓冲区用于为每个像素计算深度值和实现深度测试。深度测试通过比较 像素深度来决定是否将该像素写入后台缓冲区的特定像素位置。只有离观察者最近的像素才 会胜出,成为写入后台缓冲区的最终像素。这很容易理解,因为离观察者最近的像素会遮挡 它后面的其他像素。 深度缓冲区是一个纹理,所以在创建它时必须指定一种数据格式。
用于深度缓存的格式如下:
类型 | 含义 |
---|---|
DXGI_FORMAT_D32_FLOAT_S8X24_UINT | 32 位浮点深度缓冲区,为模板缓冲区 预留 8 位(无符号整数),每个模板值的取值范围为[0,255],其余 24 位闲置 |
DXGI_FORMAT_D32_FLOAT | 32 位浮点深度缓冲区 |
DXGI_FORMAT_D24_UNORM_S8_UINT | 无符号 24 位深度缓冲区,每个深度值的 取值范围为[0,1]。为模板缓冲区预留 8 位(无符号整数),每个模板值的取值范围为 [0,255] |
DXGI_FORMAT_D16_UNORM | 无符号 16 位深度缓冲区,每个深度值的取值范围为 [0,1] |
七、多重采样
因为计算机显示器上的像素分辨率有限,所以当我们绘制一条任意直线时,该直线很难确地显示在屏幕上。图 4.4 中的第一条直线说明了“阶梯”(aliasing,锯齿)效应,当使用像素矩阵近似地表示一条直线时就会出现这种现象,类似的锯齿也会发生在三角形的边缘上。
我们可以看到,第一条直线带有明显的锯齿(当使用像素矩阵近似地表示一条直线时就会出现阶梯效应)。而第二条直线使用了抗锯齿技术,通过对一个像素周围的邻接像素进行采样得到该像素的最终颜色;这样可以形成一条较为平滑的直线,使阶梯效果得到缓解。
通过提高显示器的分辨率,缩小像素的尺寸,也可以有效地缓解一问题,使阶梯效应明显降低。 当无法提高显示器分辨率或分辨率不够高时,我们可以使用抗锯齿(antialiasing)技术。 其中的一种技术叫做超级采样(supersampling),它把后台缓冲和深度缓冲的大小提高到屏幕分辨率的 4 倍。3D 场景会以这个更大的分辨率渲染到后台缓存中,当在屏幕上呈现后台缓冲时,后台缓冲会将 4 个像素的颜色取平均值后得到一个像素的最终颜色。从效果上来说, 超级采样的工作原理就是以软件的方式提升分辨率。 超级采样代价昂贵,因为它处理的像素数量和所需的内存数量增加为原来的 4 倍。
Direct3D 支持另一种称为多重采样(multisampling)的抗锯齿技术,它通过对一个像素的 子像素进行采样计算出该像素的最终颜色,比超级采样节省资源。假如我们使用的是 4X 多 重采样(每个像素采样 4 个邻接像素),多重采样仍然会使用屏幕分辨率 4 倍大小的后台缓 冲和深度缓冲,但是,不像超级采样那样计算每个子像素的颜色,而是只计算像素中心颜色 一次,然后基于子像素的可见性(基于子像素的深度/模板测试)和范围(子像素中心在多 边形之外还是之内)共享颜色信息。下图展示了这样的一个例子。
如图(a)所示,一个像素与多边形的边缘相交,像素中心的绿颜色存储在可见的三个子像素中,而第 4 个子像素没有被多边形覆盖,因此不会被更新为绿色,它仍保持为原来绘制的几何体颜色或 Clear 操作后的颜色。如图(b)所示,要获得最后的像素颜色, 我们需要对 4 个子像素(3 个绿色和一个白色)取平均值,获得淡绿色,通过这个操作,可以减弱多边形边缘的阶梯效果,实现更平滑的图像。