Real-Time Rendering-第一章 Introduction

最新推荐文章于 2021-11-08 16:13:20 发布

chenjinxian_3D

最新推荐文章于 2021-11-08 16:13:20 发布

阅读量1.6k

点赞数 2

分类专栏： Real-Time Rendering（第3版）文章标签：实时渲染

Real-Time Rendering（第3版）专栏收录该内容

13 篇文章 2 订阅

订阅专栏

第一章 Introduction（导论）

实时渲染主要是有关使用计算机如何快速生成图像的过程，这是计算机图形学中最具有交互性的领域。交互性是指在屏幕上显示了一幅图像，观察者会据此作出某些行动或反应，并反馈给计算机以生成下一幅图像。当这种不断反应并渲染的循环过程执行的速度足够快时，观察就会沉浸在一种动态的变化过程中，而不是简单地看到多个单独的图像。

图像显示的速度可以使用frames per second（fps）或者Hertz（Hz）进行表示。如果一秒钟渲染一帧图像，就无法感觉到交互性，观察都就会痛苦的等等每一幅新图像的到来。当渲染速度达到大约6 fps，就会开始产生一点点交互的感觉。如果一个应用程序的显示速度达到15 fps就完全是实时的，观察都就可以重点关注作用和反作用。然而，实时的交互性有一个上限。在显示速度大于等于72 fps时，实时性就无法有效的察觉到。

虽然图像闪烁速度达到60 fps时显示效果可能就是可接受的，但是要减少交互响应时间，一个更高的速度是非常重要的。即使是延迟时间尽可能少于15毫秒也会降低并干扰交互性。如果以速度作为唯一标准，任何应用程序只要能够快速响应用户命令并在屏幕上绘制图像都是符合要求的。实时渲染通常是指三维渲染。

构成实时渲染的充分条件是交互性，以及某种意义上与三维空间的关联性，但是定义实时渲染还需要第三个组成部分：图形加速硬件（graphics acceleration hardware，显卡）。虽然专门用于三维图形加速的硬件已经在专业的计算机工作站中使用了很多年，但直到最近几年面向普通消费者的显卡才真正成为可能。人们普遍认为1996年推出的3Dfx Voodoo 1是第一个消费级显卡。近年来随着消费级显卡的快速发展，在家用计算机上添加一个三维图形加速硬件与添加一对扬声器一样简单。虽然对于实时渲染来说显卡不是绝对必要的，但是在大多数实时应用程序中却是不可或缺的。图1.1中显示了一个使用显卡执行实时渲染的示例生成的逼真的图像结果。
ATI Toy Shop demo
图1.1. A wonderful image from the Toy Shop demo [1246, 1247, 1249], generated at interactive rates. (Image courtesy of Natalya Tatarchuk, ATI Research, Inc.)

在过去的几年里，显卡的发展在交互式计算机图形学领域已经得到了爆发式的研究成果。在本书中我们将重点讲解提高渲染速度以及改进图像质量的方法，同时还会描述加速算法和图形APIs的特点及局限性。由于我们无法深入涵盖每一个图形学主题，因此本书旨在介绍概念和术语，使读者在一定程度上知道如何以及何时使用某种方法，并提供深入学习某个主题的最好的参考资料。我们希望本书中所提供的内容是值得你花时间和精力去学习的。

1.1 Contents Overview（内容概述）

以下先简要概述本书所有章节的内容。

第2章，The Graphics Rendering Pipeline。本章描述了实时渲染的核心内容，即把一个场景描述的输入数据，经过处理转化成我们能直接看到的图像。
第3章，The Graphics Processing Unit（GPU）。现代的GPU架构一般会结合使用fixed-function（固定功能）和programmable units（可编程单位）实现rendering pipeline的各个阶段。
第4章，Transforms（变换操作）。Transforms是一组变换矩阵，用于操控objects的位置，方向，尺寸和形状，以及camera所处的位置和观察方向。
第5章，Visual Appearance。本章开始讨论材质和光照的定义，以及使用它们实现逼真的外观。另外还讨论了其他的与显示外观相关的主题，比如通过antialiasing（抗锯齿）和gamma correction（伽玛较正）生成更高质量的图像。
第6章，Texturing（纹理贴图）。实时渲染最强大的功能之一是能够快速读取并显示纹理数据，比如在物体表面显示图片。本章主要讨论这种称为纹理贴图技术的实现机制，并举出了这种技术的各种使用方法。
第7章，Advanced Shading（高级着色）。本章主要讨论正确显示材质的理论与实践方法，以及point light（点光源）的使用方法。
第8章，Area and Environmental Lighting（区域和环境光照）。在这一章，将会详细探讨多种光源以及相关算法。
第9章，Global Illumination（全局光照）。首先介绍了shadow（阴影），reflection（反射），refraction（折射）算法，然后讨论了有关radiosity（辐射着色），ray tracing（光线追踪），precomputed lighting（预计算光照）和ambient occlusion（环境光遮蔽）的主题内容。
第10章，Image-Based Effects。在描述类似于自然光斑或火焰现象（或物体）时，使用polygons并不是最快或最真实的实现方法。本章将会讨论一些基于图像处理技术的不同的表示方法。比如，high-dynamic range rendering（高动态光照渲染），motion blur（动态模糊），以及depth of field（景深）相关的post-processing效果。
第11章，Non-Photorealistic Rendering。试图使一个场景看起来更加逼真只是众多渲染样式中的一种。本章主要讨论其他的渲染样式，比如cartoon shading（卡通着色）。
第12章，Polygonal Techniques。Geometric数据的来源非常广泛，有时需要修改这些数据以加快速度更好的进行渲染。本章主要讨论polygonal data（多边形数据）并对多边形进行整理简化。此外，还会讨论更精细的表示多边形的方式，比如triangle strips，fans以及meshes。
第13章，Curves and Curved Surface（曲线和曲面）。使用硬件渲染几何图形从根本上来说是绘制点，线，多边形。只要在质量和渲染速度之间保持平衡，使用越复杂的曲面可以产生更精致的画面以及更光滑的表面。
第14章，Acceleration Algorithms（加速算法）。完成了渲染之后，我们开始讨论如何加快渲染速度，本章主要讲解各种culling（剔除）方式，以及level of detail（LOD）渲染方法。
第15章，Pipeline Optimization。一旦某个应用程序使用高效的渲染加速算法运行，使用各种优化技术可以使该程序渲染速度更快。本章主要讨论如何找到性能的瓶颈，并解决性能问题。另外还讨论了multiprocessing渲染技术。
第16章，Intersection Test Mothods。在执行渲染，用户交互以及碰撞检测的过程中，intersection testing（相交测试）是非常重要的。本章提供了一种广泛用于几何相交测试的最高效的算法，in-depth coverage。
第17章，Collision Detection（碰撞检测）。大多数实时渲染应用的一个关键要素是判断两个物体是否发生碰撞。对于这个快速发展的领域，本章提出了一些高效的算法。
第18章，Graphics Hardware（显卡）。在前面的章节中，我们已经讨论了GPU加速算法，本章我们将重点关注显卡的如下部分：color depth（颜色深度），frame buffers（帧缓存）以及基础架构类型。另外讲述了一些具有代表性的图形加速器的研究案例。
第19章，The Future。猜想一下未来的实时渲染技术。

此外，本书的附录中还讲述了linear algebra（线性代数）和trigonometry（三角函数）。

1.2 Notation and Definitions（常用数学记号及定义）

首先，我们将讲解在本书中使用的数学记号。关于本节使用的大量记号的全面讲解请阅读附录A。

1.2.1 Mathematical Notation（数学记号）

表格1.1中总结了我们将要使用的大部分数学记号。部分概念将会在本节进行描述。

Type	Notation	Examples
angle（角度）	lowercase Greek（小写希腊字母）	$\alpha_i,\phi,\rho,\eta,\lambda242,\theta$
scalar（标量）	lowercase italic（小写斜体）	$a,b,t,u_k,v,w_{ij}$
vector or point （向量，点）	lowercase bold（小写粗体）	$\mathbf{a, u, v_s, h(\rho), \mathbf{h_z}}$
matrix（矩阵）	capital bold （首字母粗体）	$\mathbf{T(t), X, R_x(\rho)}$
plane（平面）	$\pi$ : a vector and a scalar（一个法向量及一个标量）	$\pi: \mathbf{n \cdot x}+d=0 \\ \pi_1: \mathbf{n_1 \cdot x}+d=0$
triangle（三角形）	$\bigtriangleup$ 3 points （3个点）	$\bigtriangleup\mathbf{v_0v_1v_2}, \bigtriangleup\mathbf{cba}$
line segment （线段）	two points（2个点）	$\mathbf{uv}, \mathbf{a_ib_j}$
geometric entity（几何实体）	capital italic（首字母斜体）	$A_{OBB},T,B_{AABB}$

表格1.1 Summary of the notation used in this book.

角度和标量来自 $\mathbb{R}$ （欧几里德空间），也就说这两个记号值为实数。向量和点记号以小写的粗体字母表示，并通过如下分量形式进行访问：

v = ⎛ ⎝ ⎜ v x v y v z ⎞ ⎠ ⎟,

$\mathbf{v}= \left( \begin{array}{c} v_x \\ v_y \\ v_z \end{array} \right),$
这是一种列向量的表示方式，常用于计算机图形学中。在本书的某些地方我们会使用行向量的表示形式

(vx,vy,vz) $(v_x,v_y,v_z)$ ，而不是更合理的列向量形式

(vxvyvz)T $\begin{array}{c}(v_x&v_y&v_z)^T\end{array}$ ，仅仅是因为行向量形式更容易阅读。

在homogenous coordinates（齐次坐标系，见附录A.4）中，使用 $\mathbf{v}=\begin{array}{c}(v_x&v_y&v_z&v_w)^T\end{array}$ 表示一个坐标，相应的 $\mathbf{v}=\begin{array}{c}(v_x&v_y&v_z&0)^T\end{array}$
表示一个向量， $\mathbf{v}=\begin{array}{c}(v_x&v_y&v_z&1)^T\end{array}$ 表示一个坐标点。有时我们只使用三维向量和坐标点，但是要避免在向量和坐标点的类型表示之间变得模糊不清。对于矩阵运算，使用同样的记号表示向量和坐标点是非常有利的（见第4章的变换运算，以及附录A.4的齐次记号）。在某些算法中，使用数字索引如 $\mathbf{v}=\begin{array}{c}(v_0&v_1&v_2)^T\end{array}$ 的表示形式更方便，而不是使用 $x,y,z$ 索引。这些表示向量和坐标点的方式同样适用于二维向量；在这种情况下，只是简单地忽略一个三维向量的最后一个分量。

接下来我们更详细地讲解矩阵。常用的矩阵大小分别是 $2\times2$ , $3\times3$ 和 $4\times4$ 。首先让我们回顾一下 $3\times3$ 矩阵 $\mathbf{M}$ 的访问方式，对该方式进行简单地扩展就可以用于访问任意大小的矩阵。矩阵 $\mathbf{M}$ 的（标量）元素使用 $m_{ij}，0\leq(i, j)\leq2$ 表示，其中 $i$ 表示行号 $j$ 表示列号，如公式1.2所示：

M = ⎛ ⎝ ⎜ m 00 m 10 m 20 m 01 m 11 m 21 m 02 m 12 m 22 ⎞ ⎠ ⎟ . (1.2)

$\qquad\qquad\qquad\qquad \mathbf{M}=\left(\begin{array}{ccc} m_{00}&m_{01}&m_{02}\\m_{10}&m_{11}&m_{12}\\m_{20}&m_{21}&m_{22} \end{array}\right).\qquad\qquad\qquad\qquad\qquad\qquad\qquad(1.2)$
另外如公式1.3所示，对于一个

3×3 $3\times3$ 的矩阵，可以使用以下记号把向量从矩阵

M $\mathbf{M}$ 中把向量独立出来：

m,j $m_{,j}$ 表示第

j $j$ 列向量，

mi, $m_{i,}$ 表示第

i $i$ 行向量（以列向量形式表示）。同向量和坐标点一样，也可以使用

x，y，z $x，y，z$ 作为访问列向量的索引，如果能使得运算更方便的话，有时还包含

w $w$ ：

M = (m, 0 m, 1 m, 2) = (m x m y m z) = ⎛ ⎝ ⎜ ⎜ m T 0 m T 1 m T 2 ⎞ ⎠ ⎟ ⎟ . (1.3)

$\qquad\qquad\qquad\mathbf{M}= \left( \begin{array}{c} \mathbf{m}_{,0}&\mathbf{m}_{,1}&\mathbf{m}_{,2} \end{array} \right)= \left( \begin{array}{c} \mathbf{m}_x&\mathbf{m}_y&\mathbf{m}_z \end{array} \right)= \left( \begin{array}{c} m_0^T\\m_1^T\\m_2^T \end{array} \right).\qquad\quad(1.3)$

平面的表示方式为 $\pi: \mathbf{n \cdot x}+d=0$ ，这种方式包含了平面的数学方程式，平面的法向量 $\mathbf{n}$ 和标量 $d$ 。其中法向量描述了平面的朝向。对于更普遍的表面（比如曲面），法向量描述了表面上某个特定点的方向。而对于平面，同一个法向量可以用于表示平面上所有点的方向。通常使用数学记号 $\pi$ 表示一个平面。在三维空间中，平面把空间分为positive half-space（正半空间）和nagetive half-space（负半空间）分别表示为 $\mathbf{n\cdot x}+d>0$ 和 $\mathbf{n\cdot x}+d<0$ 。其他所有的坐标点都位于平面上。

使用三个坐标点 $\mathbf{v}_0，\mathbf{v}_1，\mathbf{v}_2$ 可以定义一个三形，并表示为 $\bigtriangleup\mathbf{v}_0\mathbf{v}_1\mathbf{v}_2$ 。

表格1.2中列出一些其他的数学运算符和对应的记号。其中，dot（点积），cross（叉积），determinant（行列式），length（长度）运算符在附录A进行了详细讲解。

Num	Operator	Description
1:	$\cdot$	dot product（点积）
2:	$\times$	cross product（叉积）
3:	$\mathbf{v}^T$	向量 $\mathbf{v}$ 的转置
4:	$\otimes$	分段向量乘法
5:	$\perp$	正交点积一元运算符
6:	$\|\cdot\|$	矩阵的行列式
7:	$\|\cdot\|$	标量的绝对值
8:	$\\|\cdot\\|$	参数的长度（模）
9:	$n!$	阶乘
10:	$\binom{n}{k}$	二项式系数

表格1.2 Notation for some mathematical operators.

transpose（转置）运算符用于把一个列向量转换成行向量，反之亦然。因为可以使用压缩的形式把列向量写到一个文本块中，如 $\mathbf{v}=\begin{array}{c}(v_x&v_y&v_z)^T\end{array}$ 。第4个操作符需要进一步讲解： $\mathbf{u}\otimes\mathbf{v}$ 表示向量 $\begin{array}{c}(u_xv_x&u_yv_y&v_zv_z)^T\end{array}$ ，即向量 $\mathbf{u}$ 的 $i$ 分量和向量 $\mathbf{v}$ 的 $i$ 分量相乘，并把乘积保存到一个新向量对应的 $i$ 分量中。在本书中，该运算符专门用于颜色向量的乘法运算。第5个运算符引自Graphics Gems IV，是用于一个二维向量的一元运算符。对一个向量 $\mathbf{v}=\begin{array}{c}(v_x&v_y)^T\end{array}$ 执行这种运算符操作，可以得到向量 $\mathbf{v}$ 的正交向量，即 $\mathbf{v}^\perp=\begin{array}{c}(-v_y&v_x)^T\end{array}$ 。记号 $|a|$ 表示标量 $a$ 的绝对值，相应的，矩阵 $\mathbf{A}$ 的行列式使用记号 $|\mathbf{A}|$ 表示。有时，矩阵 $\mathbf{A}$ 的行列式也可以表示为 $|\mathbf{A}|=|\begin{array}{c}\mathbf{a}&\mathbf{b}&\mathbf{c}\end{array}|=$ det $(\mathbf{a,b,c})$ ，其中 $\mathbf{a，b，c}$ 为矩阵的列向量。第9个操作符是一个阶乘操作符，定义如下：

n! = n (n - 1) (n - 2) \dots 3 \cdot 2 \cdot 1. (1.4)

$\qquad\qquad\qquad\qquad\qquad n!=n(n-1)(n-2)\cdots3\cdot2\cdot1.\qquad\qquad\qquad\qquad\qquad(1.4)$
另外需要注意

0!=1 $0!=1$ 。

第10个操作符是一个二项式系数，定义为公式1.5所示：

(n k) = n ! k ! ( n - k ) ! . (1.5)

$\qquad\qquad\qquad\qquad\qquad\qquad\qquad \binom{n}{k}=\frac{n!}{k!(n-k)!}.\qquad\qquad\qquad\qquad\qquad\quad(1.5)$

进一步我们可以把平面 $x=0$ ， $y=0$ 和 $z=0$ 称为coordinate planes（坐标平面）或axis-aligned planes（轴对齐平面）。同时，把轴 $\mathbf{e}_x=\begin{array}{c}(1&0&0)^T\end{array}$ ， $\mathbf{e}_y=\begin{array}{c}(0&1&0)^T\end{array}$ 和 $\mathbf{e}_z=\begin{array}{c}(0&0&1)^T\end{array}$ 称为main axes（主轴）或main directions(主方向），通常对应为 $x$ 轴， $y$ 轴和 $z$ 轴。此外，这三个轴通常被称为standard basis（标准基）。除非特别说明，我们将统一使用正交基（由一组相互垂直的单位向量组成；见附录 A.3.1）。

记号 $[a,b]$ 表示一个同时包括a和b值的范围，并且该范围内的所有数值都介于a和b之间。如果要表示一个所有数介于a和b之间但不包括a和b本身的数值范围，则使用记号 $(a,b)$ 。另外，还可以组合使用这些记号，例如 $[a,b)$ 表示所有介于a和b之间的数值，但是该范围包含a而不包含b。

在本书中经常会用到C语言数学库函数 $\mathrm{atan2(y, x)}$ ，因此专门在这里讲解一下。该函数是对三角函数 $\arctan(x)$ 的扩展。这两个函数主要不同的地方是值域不同，分别为 $0\leq \mathrm{atan2(y, x)} <2\pi$ 和 $-\frac{\pi}{2}<\arctan(x)<\frac{\pi}{2}$ ，另外在 $\mathrm{atan2(y, x)}$ 函数中还有一个额外的参数。要避免该参数值为0，以免产生除以0的运算，即执行 $x=\mathrm{y/x}$ 时避免 $\mathrm{x}=0$ 。

Num	Function	Description
1:	$\mathrm{atan2(y, x)}$	two-value arctangent
2:	$\overline\cos(\theta)$	clamped cosine
3:	$\log(n)$	natural logarithm of $n$ （ $n$ 的自然对数）

表格1.3 Notation for some specialized mathematical functions.

第2个要介绍的函数是clamped-cosine（约束的余弦函数） $\overline\cos(\theta)$ ，该函数是为了使shading公式不至于太难阅读。如果正常的余弦函数值小于0，则clamped余弦函数就会返回0值。

第3个函数是 $\log(n)$ ，在本书中该记号表示自然对数 $\log_e(n)$ ，而不是底为10的对数 $\log_{10}(n)$ 。

此外，我们使用右手坐标系（见附录A.2），因为这是计算机图形学领域表示三维几何的标准坐标系。
颜色值使用一个包含3个元素分量的向量表示，比如 $(red，green，blue)$ ，其中每一个元素分量都介于范围 $[0,1]$ 之间。

1.2.2 Geometrical Definitions（几何表示）

大部分显卡使用的基本渲染图元（也称为绘制图元）分别是点，线和三角形。

除了点，线和三角形，唯一的例外是Pixel-Planes，可以直接绘制球体，NVIDIA NV1芯片可以直接绘制椭圆体。

在本书中，我们把几何体的集合称为模型或物体。把渲染环境中包含的全部模型的集体称为场景。此外，在场景中还可以包含材质描述，光照，以及观察规范。

物体有多种表示形式，比如一辆汽车，一幢大楼，甚至是一个线条。在实际工作过程中，通常使用一组绘制图元表示一个物体，但是凡事都有例外情况；一个物体还可能包含一种更高级的几何表示，比如贝塞尔曲线或曲面，细分表面等等。另外，物体也可以由其他的物体组成，例如，一个汽车模型的车门可以称为一个物体或都汽车的子集。