计算机图形学与opengl C++版学习笔记第3章数学基础

Doggerlas（毕业版）

已于 2023-05-21 23:24:15 修改

阅读量918

点赞数 1

分类专栏：计算机图形学与opengl C++版学习笔记文章标签： c++

于 2023-05-21 23:09:26 首次发布

本文链接：https://blog.csdn.net/weixin_44848751/article/details/130796151

版权

计算机图形学与opengl C++版学习笔记专栏收录该内容

15 篇文章 24 订阅

订阅专栏

文章介绍了3D空间中的坐标系统，包括左手和右手坐标系，以及点、矩阵、变换矩阵的概念。重点讲述了平移、缩放和旋转矩阵的构建和应用，以及向量的点积和叉积。此外，还讨论了局部空间、世界空间、视觉空间和投影矩阵，包括透视投影和正射投影。LookAt矩阵用于设置相机视角。GLSL和GLM库在实现这些变换中的作用也被提及。

摘要由CSDN通过智能技术生成

3.1 3D坐标系统

3D空间通常用3个坐标轴X、Y和Z来表示。这3个轴可以以两种方式来布置：左手或右手（它们是以轴的朝向来命名的，通过左手或右手大拇指与食指、中指成直角来进行构造）。如图3.1所示
在这里插入图片描述

图3.1 3D坐标系统

OpenGL中的坐标系大体是右手坐标系，而Direct3D中大体是左手坐标系。在本书中，除非特别说明，否则我们都是用右手坐标系。

大拇指代表Z轴，食指代表X轴，中指代表Y轴。图3.1中，左手大拇指向外，手心向上；右手大拇指向内，手心向上。 ——译者注

3.2 点

3D空间中的点可以通过使用形如（2, 8, −3）的符号，列出X、Y、Z的值来表示。不过，如果用齐次坐标表示法来表示点会更有用。在每个点的齐次坐标有4个值。前3个值表示X、Y和Z，第四个值W总是非零值，通常为1。因此，我们会将之前的点表示为（2, 8, −3, 1）。

齐次坐标将会使我们的图形学计算更高效。用来存储齐次3D坐标的GLSL数据类型是vec4（“vec”代表向量，同时也可以用来表示点）。GLM库包含适合在C++/OpenGL应用中创建和存储3元和4元（齐次）点的类，分别叫作vec3和vec4

3.3 矩阵

矩阵是矩形的值阵列，它的元素通常使用下标访问。第一个下标表示行号，第二个下标表示列号，下标从0开始。我们在3D图形计算中要用到的矩阵大多数大小为4×4，如图3.2所示。
在这里插入图片描述

图3.2 4×4矩阵

GLSL语言中的mat4数据类型用来存储4×4矩阵。同样，GLM中有 mat4类用以实例化并存储4×4矩阵。

单位矩阵：单位矩阵中一条对角线的值为1，其余值全为0：任何值乘以单位矩阵都不会改变。在GLM中，调用构造函数glm::mat4 m(1.0f)以在变量m中生成单位矩阵。
矩阵转置：矩阵转置的计算是通过交换矩阵的行和列完成的。例如：

GLM库和GLSL库都有转置函数，分别是glm::transpose(mat4)和
transpose(mat4)。
矩阵相加：矩阵加法简单明了

在GLSL中，+运算符在mat4上进行了重载，以支持矩阵加法。
矩阵相乘(合并)：3D图形学中有很多有用的矩阵乘法操作。矩阵乘法一般可以从左向右或从右向左处理（注意，由于左乘和右乘是不同的，所以矩阵乘法不满足交换律）。在3D图形学中，点与矩阵相乘通常从右向左，得到点，如：

注意，我们用齐次坐标将点(X, Y, Z)表示为列数为1的矩阵。
GLSL和GLM都支持点（确切地说是vec4）与矩阵使用操作符相乘。
4×4矩阵与4×4矩阵相乘如下：

矩阵相乘也经常叫作合并，稍后我们会看到，它可以用于将一系列矩阵变换合并成一个矩阵。这种合并矩阵变换的能力来自矩阵乘法的结合律。
考虑如下运算序列：

我们将一个点与Matrix3相乘，之后将结果与Matrix2相乘，最后将结果与Matrix1相乘。其结果是一个新的点。结合律确保了之前的计算与如下计算相同：

我们先将3个矩阵相乘，建立Matrix1、Matrix2、Matrix3的连接。如果我们称其为MatrixC，我们就可以将之前的运算写作：

我们稍后在第4章会看到这么做的好处是，我们需要经常将相同的一系列矩阵变换应用到场景中的每个点上。通过预先一次计算好这些矩阵的合并，就可以成倍减少总的矩阵运算量。
GLSL和GLM都支持使用重载后的运算符进行矩阵乘法。
逆矩阵：一个4×4矩阵的逆矩阵是另一个4×4矩阵，用M^(-1)表示，在矩阵乘法中有如下性质：

在此我们就不展示计算逆矩阵的细节了。但是，需要知道的是计算矩阵的逆矩阵的运算量很大。幸运的是我们只有很少情况下需要用到它。在这些极少的情况下，GLSL和GLM都提供了mat4.inverse()函数。

3.4 变换矩阵

在图形学中，矩阵通常用来进行物体的变换。例如矩阵可以用来将点从一处移动到另一处。在本章中，我们将会学习5个有用的变换矩阵：平移矩阵；缩放矩阵；旋转矩阵；投影矩阵； LookAt矩阵。

变换矩阵的重要特性之一就是它们都是4×4矩阵。这是因为我们决定使用齐次坐标系。否则，各变换矩阵可能会有不同的维度并且无法相乘。

3.4.1 平移矩阵

平移矩阵用于将物体从一个位置移至另一位置。它包含一个单位矩阵，同时X、Y和Z的移动量在A ₀₃ A₁₃ A₂₃。图3.3展示了平移矩阵和它与齐次坐标点相乘的效果。其结果是一个以平移值“移动过”的点。
在这里插入图片描述

图3.3 平移矩阵变换

注意，作为与平移矩阵相乘的结果，点(X,Y,Z)平移(或移动)到位置(X+T_X, Y+T_Y, Z+T_Z,)。同样需要注意的是这个乘法是从右向左相乘。

GLM中有一些函数是用于构建与点相乘的平移矩阵的。其中相关的操作有：
• glm::translate(x, y, z)构建平移(X,Y,Z)的矩阵
• mat4 * vec4。

3.4.2 缩放矩阵

缩放矩阵用于改变物体的大小或者将点向原点相反方向移动。虽然缩放点这个操作乍一看有点奇怪，不过OpenGL中的物体都是用一组或多组的点定义的。因此，缩放物体涉及缩放它的点的集合。

缩放矩阵变换由单位矩阵和位于A₀₀ A₁₁ A₂₂的XYZ缩放因子组成。图3.4中展示了缩放矩阵的形式和当它与齐次坐标点相乘的效果：所得的结果是经过缩放值修改后的新点。
在这里插入图片描述

图3.4 缩放矩阵变换

GLM中有一些函数是用于构建与点相乘的缩放矩阵的。其中相关的操作有：
• glm::scale(x, y, z) 构建缩放(X,Y,Z)的矩阵；
• mat4 * vec4

缩放还可以用来切换坐标系。例如，我们可以用缩放来在给定右手坐标系的情况下确定左手坐标。从图3.1中我们可以看到通过反转Z坐标就可以在右手坐标系和左手坐标系中切换，因此，用来切换坐标系的缩放矩阵变换是：
在这里插入图片描述

3.4.3 旋转矩阵

旋转会稍微复杂一些，因为在3D空间中旋转物体需要指定旋转轴和旋转的角度或弧度。

在16世纪中叶，数学家莱昂哈德· 欧拉表明，围绕任何轴的旋转都可以表示为绕 X,Y,Z轴旋转的组合[EU76]。围绕这3个轴的旋转角度被称为欧拉角。这个被称为欧拉定理的发现，对我们很有用，因为对于每个坐标轴的旋转可以用矩阵变换来表示。

旋转变换有3种，分别是绕X Y和Z轴旋转，见图3.5。同时GLM中也有一些用于构建旋转矩阵的函数。
• glm::rotate(mat4, θ, x, y, z)构建绕X Y Z轴旋转θ度的缩放矩阵。
• mat4*vec4。
在这里插入图片描述

图3.5 旋转变换矩阵

实践中，当3D空间中旋转轴不穿过原点时，物体使用欧拉角进行旋转需要几个额外的步骤。一般有：

平移旋转轴以使它经过原点；
绕XYZ轴旋转适当的欧拉角；
复原步骤（1）中的平移。

图3.5中所示的3个旋转变换都有自己有趣的特性，即反向旋转的矩阵恰等于其转置矩阵。后面将会用到这个特性。

欧拉角在某些3D图形应用中会导致一些瑕疵。因此，通常在计算旋转时推荐使用四元数。有兴趣探索四元数的读者可以寻求很多已有的资源（如[KU98]）。欧拉角足以满足我们的大部分需求。

3.5 向量

向量表示大小和方向。它们没有特定位置。“移动”向量并不改变它所代表的含义。

记录向量的方法各式各样，如：一端带箭头的线段、二元组（幅度+方向）或两点之差。

在3D图形学中，向量一般用空间中的单个点表示，向量的大小是原点到该点的距离，方向则是原点到该点的方向。在图3.6中，向量V可以用点P₁ P₂之间的差表示，也可以等价地用原点到P₃的距离来表示。在我们的所有应用中，我们都简单地将V表示为(X,Y,Z)，即我们用来表示P₃的符号。
在这里插入图片描述

图3.6 向量V的两种表示

用与表示点相同的方式来表示向量很方便，因为我们对点和向量用同样的矩阵变换。不过这也会使人困惑。因此，我们有时候会在向量上加一个小箭头。

许多图形系统并不区分点和向量，如GLSL 和GLM，它们所提供的vec3/vec4类型既能用来存储点，又能用来存储向量。

在GLM和GLSL中有许多3D图形学中经常用到的向量操作。如假设有向量A (u,v,w)和B(x,y,z)

加减法：
A±B=(u±x,v±y,w±z)
glm: vec3 ± vec3
GLSL: vec3 ± vec3
归一化（变为长度 =1）：
加粗样式
glm: normalize(vec3) 或normalize(vec4)
GLSL: normalize(vec3) 或normalize(vec4)
点积：
A•B=ux+vy_wz
glm: dot(vec3,vec3) 或dot(vec4,vec4)
GLSL: dot(vec3,vec3) 或dot(vec4,vec4)
叉积：
AXB=(vz-wy,wx-uz,uy-vx)
glm: cross(vec3,vec3)
GLSL: cross(vec3,vec3)

其他有用的向量函数如magnitude（在GLSL和GLM中是 length()）、reflection和refraction（在GLSL和GLM中都有）。

我们现在仔细看一下点积和叉积函数。

3.5.1 点积的应用

(参考这个)在本书中的程序大量使用了点积。点积最重要也最基本的应用是求解两向量夹角。点设有向量V和W ，计算其夹角为θ
在这里插入图片描述

因此，如果V和 W是正规化向量（有着单位长度的向量——这里用“^”标记正规化），则有：
在这里插入图片描述

有趣的是，我们后面会看到通常用到的是cos(θ)，而非θ。因此，这两个推导出的公式都很有用。点积同时还有许多其他用途。
求解向量的大小：
在这里插入图片描述

求解两向量是否正交，若正交，则
在这里插入图片描述

求解两向量是否平行，若平行，则
在这里插入图片描述

求解两向量是否平行但指向相反方向，若满足，则
在这里插入图片描述

求解两向量夹角是否在（−90°～+90°）：
在这里插入图片描述

求解点P=(X,Y,Z)到平面S=(a,b,c,d)的最小有符号距离:
首先，求垂直于S的单位法向量：
在这里插入图片描述

以及从原点到平面的最短距离
在这里插入图片描述
之后从P到S的最小有符号距离为(n ̂•P)+D，其符号由P在S的哪边决定

3.5.2 叉积的应用

(参考这个)两向量叉积的一个重要特性是，它会生成一个新的向量，新的向量正交（垂直）于之前两个向量所定义的平面。我们会在本书中大量使用到这一特性。

任意两个不共线向量都定义了一个平面。例如考虑两个任意向量V和W。由于向量可以在不改变含义的情况下进行平移，因此，可以将它们移动到起点相交的位置。图3.7展示了V和W定义的平面，以及其叉积所得法向量。其所得法向量的方向遵循右手定则，即将右手手指从 V向W卷曲会使得大拇指指向法向量R
在这里插入图片描述

图3.7 叉积得到法向量

注意，这里顺序很重要。W×V将会得到与R方向相反的向量。

通过叉积来获得法向量的能力对我们后面要学习的光照部分非常重要。为了确定光照效果，我们需要知道所渲染模型的外向法向量。图3.8中展示了一个例子，其中有一个6个点（顶点）构成的简单模型，使用叉积计算来获得其中一面的外向法向量。
在这里插入图片描述

图3.8 计算外向法向量

3.6 局部和世界空间

3D图形学（用OpenGL或其他框架）常见的应用是模拟三维世界、在其中放入物体并在显示器上观看它。放在3D世界的物体通常用三角形的集合来进行建模。稍后我们会在第6章中详细讲解建模。但是我们可以先了解一下大致的处理过程。

当建立物体的3D模型时，我们通常以最方便的定位方式描述模型。如果模型是个球形，那么我们很可能将球心定位于原点（0,0,0）并赋予它一个方便的半径，比如1。模型定义的空间叫作局部空间（local space）或模型空间（model space）OpenGL文档使用的术语是物体空间（object space）。之后这个球形可能用于一个大模型的部分，如成为机器人的头部。这个机器人，当然，定义在它自己的局部/模型空间。我们可以用图3.9所示的矩阵变换通过缩放、旋转和平移，将球形模型放在机器人模型的空间。通过这种方式，可以分层次地构建复杂模型（在4.8节中会进一步通过使用一堆矩阵讲解这个主题）。
在这里插入图片描述

图3.9 球形和机器人的模型空间

使用同样的方式，通过设定物体在模拟世界中的朝向和大小，将物体放在模拟这个世界的空间中，这个空间叫作世界空间。将对象定位及定向在世界空间的矩阵称为模型矩阵或M。

3.7 视觉空间和合成相机

到此为止，我们所接触的变换矩阵全都在3D空间中操作。但是，我们最终需要将3D空间——或它的一部分——展示在2D显示器上。为了达成这个目标，我们需要找到一个有利点。正如我们在现实世界通过眼睛从一点观察一样，我们也必须找到一点并确立观察方向作为我们观察虚拟世界的窗口。这个点叫作“视图”或“视觉”空间，或 “合成相机”。

如图3.10和图3.12所示，观察3D世界需要：

将相机放入世界的某个位置；
调整相机的角度，通常需要一套它自己的直角坐标UVN
定义一个视体（view volume）；
将视体内的对象投影到投影平面（projection plane）上。

在这里插入图片描述

图3.10 将相机放入3D世界中

OpenGL有一个固定在原点(0,0,0)并向下看向Z轴负方向的相机，如图3.11所示
在这里插入图片描述

图3.11 OpenGL固定相机

为了应用OpenGL相机，我们需要做的是将它模拟移动到适合的位置和方向。我们需要先找出在世界中的物体与我们期望的相机位置的相对位置（如物体应该在由图3.12所示相机UVN轴定义的“相机空间”中的何处）。给定世界空间中的点P_W，我们需要通过变换将它转换成相应相机空间中的点，从而让它看起来好像是我们从期望的相机位置C_W进行观看的。我们通过计算它在相机空间中的位置P_c实现。已知OpenGL相机位置永远固定在点(0,0,0)，问：我们如何变换来实现上述功能？(参考这个)
在这里插入图片描述

图3.12 相机方向

需要做的变换如下：

将P_W平移，其向量为负的期望相机位置
将P_W旋转，其角度为负的期望相机旋转的欧拉角

我们可以构建一个单一变换矩阵以完成旋转和平移，这个矩阵叫作视图变换（viewing transform）矩阵V。矩阵V通过合并矩阵T（包含负相机期望位置的平移矩阵）和R（包含负相机期望旋转的旋转矩阵）。在本例中，从右向左，我们先平移世界空间中的点P_W，之后旋转：
在这里插入图片描述

如前所见，通过结合律我们得到如下运算：
在这里插入图片描述

如果我们将合并后的R*T存入矩阵V，运算成为
在这里插入图片描述

完整的计算以及T和R的准确内容在图3.13中（我们忽略了对矩阵R的推导——推导过程见参考资料[FV95]）。
在这里插入图片描述

图3.13 推导视图矩阵

通常V矩阵与模型矩阵M合并成为一个模型-视图（model-view MV矩阵）
在这里插入图片描述

之后，点P_M在从自己的模型空间通过如下一个步骤就可以直接转换至相机空间：
在这里插入图片描述

在复杂场景中，当我们需要对每个顶点，而非只是一个点做这个变换的时候，这种方法的好处就很明显了。通过预先计算MV，对于空间中每个点的变换只需要我们进行一次矩阵乘法计算。之后，我们将会看到，我们可以将这个过程延伸到与计算更多的合并矩阵，以大量减少每个顶点的计算量。

3.8 投影矩阵

当我们设置好相机之后，就可以学习投影矩阵了。我们需要学习的两个重要的投影矩阵是：透视投影和正射投影。(参考这个)

3.8.1 透视投影矩阵

透视投影通过使用透视概念模仿我们看真实世界的方式，尝试让2D图像看起来像是3D的。物体近大远小，3D空间中有的平行线用透视法画出来就不再平行。

透视法是15世纪初～16世纪初文艺复兴时期的伟大发现之一，当时的画家开始绘制比前人更加真实的画作。图3.14中是一个绝好的例子
在这里插入图片描述

图3.14 《圣母领报》（卡洛·克里韦利，1486年）

我们通过使用变换矩阵将平行线变为恰当的不平行线来实现这个效果。这个矩阵叫作透视矩阵或者透视变换，通过定义4个参数来进行视体（view volume）的构建。其中4个参数是纵横比、视场、投影平面或近剪裁平面、远剪裁平面。

只有在远近剪裁平面间的物体才会被渲染。近剪裁平面同时也是物体所投影到的平面，通常放在离眼睛或相机较近的位置（如图3.15 左侧所示）。我们会在第4章中讨论如何为远剪裁平面选择合适的值。视场是可视空间的纵向角度。纵横比是远近剪裁平面的宽度比高度。通过这些元素所形成的形状叫作视锥（frustum），如图3.15所示。
在这里插入图片描述