Games 101 第四节课 Transformation 仅作为个人笔记使用

最新推荐文章于 2024-08-02 23:27:55 发布

LeiSir16

最新推荐文章于 2024-08-02 23:27:55 发布

阅读量185

点赞数

文章标签：线性代数矩阵算法 c++

本文链接：https://blog.csdn.net/qq_43760344/article/details/126979096

版权

Lecture4 - Transformation

0. 对上节课的补充

对于二维旋转变换，旋转角度为 $\theta$ （默认绕原点逆时针旋转 $\theta$ 度），有如下旋转变换矩阵
${\Large R_{ \theta} = \begin{bmatrix} \cos \theta & -\sin \theta \\ \sin \theta&\cos \theta \end{bmatrix}}$
如果旋转角度为 $\theta$ 度时，变换矩阵为
${\Large R_{ -\theta} = \begin{bmatrix} \cos \theta & \sin \theta \\ -\sin \theta&\cos \theta \end{bmatrix}}$
从上边两个式子我们很容易看出来 $R_{-\theta } = R_{\theta}^{T}$ ，而对于旋转角度为 $\theta$ 和旋转角度为 $-\theta$ 来说，这两个变换属于互逆变换，从上节课我们可以得知，一个变换是另外一个变换的逆变换，其变换矩阵有 $R_{-\theta } = R_{\theta}^{-1}$ ，综上，我们就可以有如下结论
$\Large{ R_{-\theta } = R_{\theta}^{-1} = R_{\theta}^{T} }$
因此，当求一个旋转变换的逆变换矩阵的时候，我们可以不再求其逆矩阵，只需要求原变换矩阵的转置即可得到逆变换矩阵。
对于线性变换和平移变换二者合起来叫做仿射变换。

1. 三维变换

1.1 基本概念

类似于二维变换，我们定义三维点坐标为 $\left ( x,y,z,{\color{Red} 1} \right ) ,^{T}$ ，三维向量可表示为 $\left ( x,y,z,{\color{Red} 0} \right ) ,^{T}$ 。通常来说对于 $\left ( x,y,z,w \right ) ^{T}$ 所表达的三维点的坐标为 $\left ( \frac{x}{w} ,\frac{y}{w},\frac{z}{w} \right ) ^{T}$ ，其中 $w\ne 0$ 。
对于三维变换矩阵可表达为
${\Large \begin{bmatrix} x^{\prime } \\ y^{\prime }\\ z^{\prime }\\ 1 \end{bmatrix} = \begin{bmatrix} a& b & c & t_{x} \\ d& e & f & t_{y}\\ g& h & i & t_{z}\\ 0& 0 & 0 & 1 \end{bmatrix}\cdot \begin{bmatrix} x \\ y\\ z\\ 1 \end{bmatrix}}$
缩放变换矩阵可表达为
${\Large S\left ( s_{x},s_{y},s_{z} \right ) = \begin{bmatrix} s_{x}& 0 & 0 & 0 \\ 0& s_{y} & 0 & 0\\ 0& 0 & s_{z} & 0\\ 0& 0 & 0 & 1 \end{bmatrix}}$
平移变换矩阵可表达为
${\Large T\left ( t_{x},t_{y},t_{z} \right ) = \begin{bmatrix} 1& 0 & 0 & t_{x} \\ 0& 1 & 0 &t_{y}\\ 0& 0 & 1& t_{z}\\ 0& 0 & 0 & 1 \end{bmatrix}}$
对于三维变换的旋转来说可能会有一些复杂，但我们可以将其分解为绕 $x$ 轴旋转，绕 $y$ 轴旋转，绕 $z$ 轴旋转，其变换矩阵可分别表达为
${\Large \begin{align*} &R_{x}\left ( \alpha \right ) = \begin{bmatrix} 1& 0 & 0 & 0\\ 0& \cos \alpha & -\sin \alpha & 0\\ 0& \sin \alpha & \cos \alpha & 0\\ 0& 0 & 0 & 1 \end{bmatrix}\\ &R_{y}\left ( \alpha \right ) = \begin{bmatrix} \cos \alpha& 0 & \sin \alpha & 0\\ 0& 1 & 0 & 0\\ -\sin \alpha& 0 & \cos \alpha & 0\\ 0& 0 & 0 & 1 \end{bmatrix}\\ &R_{z}\left ( \alpha \right ) = \begin{bmatrix} \cos \alpha& -\sin \alpha & 0 & 0\\ \sin \alpha& \cos \alpha & 0 & 0\\ 0& 0 & 1 & 0\\ 0& 0 & 0 & 1 \end{bmatrix} \end{align*}}$
因此，三维旋转可由基本的绕轴旋转组合而成，其表达式如下
${\Large R_{xyz} \left ( \alpha ,\beta, \gamma \right ) = R_{x}\left ( \alpha \right ) R_{y}\left ( \beta \right ) R_{z}\left ( \gamma \right ) }$
其中 $\alpha ,\beta, \gamma$ 叫做欧拉角，在图形学中，可以很自然地使用飞机旋转的Roll，Yaw，Pitch来表达绕轴旋转，其示意图如下

1.2 罗德里格斯公式（Rodrigues’s Formula）（参考链接）

采用一个旋转轴 $\mathbf{u }$ （默认是过坐标原点的轴）和一个旋转角 $\mathbf{\theta }$ 来刻画三维旋转。
假设一个过原点的旋转轴 $\left ( x,y,z \right ) ^{T}$ （如果不过原点，可以先把旋转轴平移至原点，进行旋转之后再移回原来位置），同时也规定 $\left \| u \right \| = 1$ ，即为一个单位向量，我们想把一个向量 $v$ 绕着这个轴旋转 $\theta$ 度变换到 $v^{\prime }$ ，示意图如下：
- 根据上一节我们可以得知，三维旋转我们可以将其分解为简单的旋转然后进行组合之后即为旋转结果，因此，我们可以先将向量 $v$ 分解为平行于旋转轴和垂直于旋转轴的两个向量
  
  ${\Large v = v_{\parallel } + v_{\perp }}$
  然后分别旋转这两个分向量，然后再将它们的旋转结果相加即可获得旋转之后的向量
  ${\Large v^{\prime } = v_{\parallel }^{\prime } + v_{\perp }^{\prime }}$
- 平行于旋转轴的向量旋转之后不变，因此， $v_{\parallel }$ 其实就是 $v$ 在旋转轴 $u$ 上的投影，一个向量由长度和方向组成，因此投影向量可以由该向量的长度与方向的乘积表达，因此可以通过点乘来计算（ $u$ 是一个单位向量， $\alpha$ 为向量 $v$ 和 $u$ 的夹角）
  ${\Large v_{\parallel }^{\prime} = \left \| v \right \| \cos \alpha \times u = \frac{\left \| u \right \| \left \| v \right \| \cos \alpha}{\left \| u \right \|}\times u = \left ( u\cdot v \right ) u}$
- 垂直于旋转轴的向量的旋转可以看作是平面内的一个旋转，因为旋转不改变 $v_{\perp }$ 的长度，所以其旋转路径是一个圆，其示意图如下，右图是俯视图
  
  由此，垂直向量的旋转就被变成了二维平面上的旋转，但在这个平面上只有一个 $v_{\perp }$ 是不够的，因此我们需要构造一个同时垂直于 $u$ 和 $v_{\perp }$ 的向量 $w$ ，这个向量我们可以通过叉乘得到
  $\Large{w = u\times v_{\perp }}$
  由叉乘的模计算公式可知， $u$ 和 $v_{\perp }$ 的夹角为 $\frac{\pi }{2}$ ，而 $u$ 又是一个单位向量，因此 $w$ 的模等于 $v_{\perp }$ 的模，也即 $w$ 也在圆上，等式如下
  $\Large{\left \| w \right \| = \left \| u\times v_{\perp } \right \| =\left \| u \right \| \left \| v_{\perp } \right \|\sin \frac{\pi }{2} = \left \|v_{\perp } \right \|}$
  有了向量 $w$ 之后我们可以将 $v_{\perp } ^{\prime }$ 投影到 $w$ 和 $v_{\perp }$ 上，并将其分解为 $v_{v}^{\prime }$ 和 $v_{w} ^{\prime }$ ，投影向量为长度和方向（单位向量）的乘积，因此可以有以下式子
  $\large{\begin{align*} v_{\perp }^{\prime } & = ~v_{v}^{\prime }+ v_{w}^{\prime }\\ & = ~ \left \| v_{\perp }^{\prime } \right \| \cos \theta \times \frac{v_{\perp }}{\left \| v_{\perp } \right \| } + \left \| v_{\perp }^{\prime } \right \| \cos \left ( \frac{\pi }{2} - \theta \right ) \times \frac{w}{\left \| w \right \| }\\ & = ~ v_{\perp } \cos \theta + \left \| v_{\perp }^{\prime } \right \| \sin\theta \times \frac{w}{\left \| w \right \| }\\ & = ~ v_{\perp } \cos \theta + w\sin\theta\\ & = ~ v_{\perp } \cos \theta + \left ( u\times v_{\perp } \right ) \sin \theta \end{align*}}$
  其中 $\left \| v_{\perp }^{\prime } \right \| = \left \| v_{\perp } \right \| = \left \| w \right \|$
- 由此将 $v_{\parallel }^{\prime}$ 和 $v_{\perp }^{\prime }$ 相加即可得到最终的变换结果
  $\Large{v^{\prime } = v^{\prime }_{\parallel }+v^{\prime }_{\perp }=v_{\parallel }+v_{\perp } \cos \theta + \left ( u\times v_{\perp } \right ) \sin \theta}$
  因为叉乘满足分配律，而且由 $v_{\perp } = v- v_{\parallel }$ 和平行的两个向量的叉乘为0可知
  ${\Large \begin{align*} u\times v_{\perp }& =~u\times \left ( v- v_{\parallel }\right ) \\ & =~u\times v-u\times v_{\parallel } \\ & =~u\times v \end{align*}}$
  最后将 $v_{\parallel } = \left ( u\cdot v \right )u$ 和 $v_{\perp } = v-\left ( u\cdot v \right )u$ 带入得到
  ${\large \begin{align*} v^{\prime } & =~\left ( u\cdot v \right )u+\cos \left ( \theta \right ) \left ( v-\left ( u\cdot v \right )u \right ) + \sin \left ( \theta \right ) \left ( u\times v \right ) \\ &=~\cos \left ( \theta \right )v+\left ( 1-\cos \left ( \theta \right ) \right ) \left ( u\cdot v \right )u+\sin \left ( \theta \right ) \left ( u\times v \right ) \end{align*}}$
由此得到了最终的罗德里格斯公式，3D 空间中任意一个 $v$ 沿着单位向量 $u$ 旋转 $\theta$ 角度之后的 $v^{\prime }$ 为
$v^{\prime }=\cos \left ( \theta \right )v+\left ( 1-\cos \left ( \theta \right ) \right ) \left ( u\cdot v \right )u+\sin \left ( \theta \right ) \left ( u\times v \right )$

2. 视图变换(View Transformation)

2.1 基本概念

如何理解模型变换，视图变换和映射变换，可以由下边一张图阐明

因此，视图变换也可以叫做Camera Transformation

2.2 定义一个摄像机

如果要进行视图变换我们首先需要定义一个摄像机，所以摄像机的定义如下
- 摄像机的位置 $\large{\vec{e}}$
- 摄像机的朝向，也即摄像机看向的方向 ${\large \hat{g} }$
- 摄像机的向上的向量 ${\large \hat{t}}$
对于现实中拍摄一张照片来说，如果摄像机和拍摄的对象保持相对运动不变，那么拍摄的结果应该是一样的，那么在这里我们规定摄像机位于坐标原点，其朝向为 $- Z$ 方向，向上向量为 $Y$ ，其示意图为
那么我们如何将一个摄像机变换（ $M_{view}$ ）到坐标原点呢，其步骤可总结如下
- 将其位置 $\large{\vec{e}}$ 平移到原点
- 旋转朝向 ${\large \hat{g} }$ 到 $- Z$ 方向
- 旋转向上向量 ${\large \hat{t} }$ 到 $Y$ 方向
- 旋转 ${\large \hat{g} }$ 与 ${\large \hat{t} }$ 的叉乘即 $\left ( \hat{g} \times \hat{t} \right )$ 到 $X$ 方向
如何使用变换矩阵来表达 $M_{view}$ 呢，可以将 $M_{view}$ 分解为先进行平移变换在进行旋转变换，即 $M_{view}=R_{view}T_{view}$
- 首先将 $\large{\vec{e}}$ 平移至原点，其平移变换矩阵为
  ${\Large T_{view} = \begin{bmatrix} 1& 0& 0& -x_{e}\\ 0& 1& 0& -y_{e}\\ 0& 0& 1& -z_{e}\\ 0& 0& 0&1 \end{bmatrix}}$
- 然后将 ${\large \hat{g} }$ 旋转至 $- Z$ ，将 ${\large \hat{t} }$ 旋转至 $Y$ ，最后将 $\left ( \hat{g} \times \hat{t} \right )$ 旋转至 $X$ 。我们比较难写出这个变换矩阵，但是我们可以很容易写出它的逆变换矩阵，即 $X$ 旋转至 $\left ( \hat{g} \times \hat{t} \right )$ ， $Y$ 旋转至 ${\large \hat{t} }$ ，最后将 $Z$ 旋转至 ${\large -\hat{g} }$ ，其旋转矩阵为
  ${\Large R_{view}^{-1} = \begin{bmatrix} x_{\hat{g}\times \hat{t} } & x_{\hat{t}} & x_{-\hat{g}}& 0\\ y_{\hat{g}\times \hat{t} }& y_{\hat{t}}& y_{-\hat{g}}& 0\\ z_{\hat{g}\times \hat{t} }& z_{\hat{t}}& z_{-\hat{g}}& 0\\ 0& 0& 0&1 \end{bmatrix}}$
  由第一部分的讲解可知逆变换矩阵是原变换矩阵的转置矩阵，因此有 $\left ( R_{view}^{-1} \right ) ^{T} = R_{view}$ ，所以
  ${\Large R_{view} = \begin{bmatrix} x_{\hat{g} \times \hat{t}} & y_{\hat{g} \times \hat{t}} & z_{\hat{g} \times \hat{t}} & 0 \\ x_{t} & y_{t} & z_{t} & 0 \\ x_{-g} & y_{-g} & z_{-g} & 0 \\ 0 & 0 & 0 & 1 \end{bmatrix}}$
- 综上可以得到摄像机变换到原点的变换矩阵 $M_{view}$ ，对于其他物体只要做相同的变换即可与摄像机保持相对静止。

3. 投影变换(Projection Transformation)

3.1 基本概念

投影变换包括正交投影(Orthographic Projection)和透视投影(Perspection Projection)，二者的区别就是是否有近大远小的视觉效果，示意图如下

其中透视投影可以看作将摄像机放置到近处，由此射出一个四棱锥，投影物体，近处平面小于远处平面，而正交投影可以看作将摄像机放置无限远处，近平面和原平面一样。

3.2 正交投影

以一种简单的方式理解正交投影：直接将物体的 $Z$ 坐标扔掉，然后在将其平移和缩放至 $\left [ -1,1 \right ] ^{2}$ 大小的矩形内就是正交投影的效果，如下图所示
通常我们会以一个立方体的平移和缩放至一个标准正方体 $\left [ -1,1 \right ] ^{3}$ 作为正交投影的解释，其变换如下图所示

其中立方体 $X$ 方向上的范围为 $\left [ l,r \right ]$ ， $Y$ 方向上的范围为 $\left [ b,t \right ]$ ，最后 $Z$ 方向上的范围为 $\left [ f,n \right ]$ ，因为摄像机的朝向是沿着 $- Z$ 方向，因此远处的坐标更小，该立方体先将其平移至原点，然后将其规范化为正方体，也即长宽高都缩放至2。其变换矩阵 $M_{ortho}$ 如下
$\Large{M_{ortho} = R_{ortho}T_{ortho}=\begin{bmatrix} \frac{2}{r-l} & 0 & 0 & 0 \\ 0 & \frac{2}{t-b} & 0 & 0 \\ 0 & 0 & \frac{2}{n-f} & 0 \\ 0 & 0 & 0 & 1 \end{bmatrix}\begin{bmatrix} 1 & 0 & 0 & -\frac{r+l}{2} \\ 0 & 1 & 0 & -\frac{t+b}{2} \\ 0 & 0 & 1 & -\frac{n+f}{2} \\ 0 & 0 & 0 & 1 \end{bmatrix}}$

3.3 透视投影

回顾： 在之前的学习中我们提到，对于点 $\left ( x,y,z,1 \right )$ 来说，将他们的坐标同时乘以个 $k$ ，其中 $k\ne 0$ ，其在三维空间中所表达的三维坐标点为 $\left ( x,y,z\right )$ ，因为 $k$ 是任意一个不为零的数，因此如果我们令 $k = z$ ，则 $\left ( xz,yz,z^{2},z\right )$ 所表达也是 $\left ( x,y,z\right )$ 点，例如坐标点 $\left ( 1,0,0,1\right )$ 和 $\left ( 2,0,0,2\right )$ 表达的都是 $\left (1,0,0\right )$ 这个点，这个小知识点在后边我们将会用到。
透视投影具有近大远小的效果，如果直接进行透视变换比较难，透视投影和正交投影对比图如下图所示

由上图我们可以看出，正交投影和透视投影的区别就是一个是立方体，一个是棱锥，因此，我们可以将透视投影通过如下步骤进行转化
- 首先将透视投影的原平面（后边比较大的那个平面）“挤压”到和近平面一样的大小，也即转化为正交投影，变换矩阵为 $M_{persp\to ortho}$
- 然后在进行正交投影变换 $M_{ortho}$
- 注意： 在”挤压过程中“我们有几个限制，在挤压过程中，近平面的大小以及位置不变，同时远平面的位置，也即上图中的 $f$ 是不变的，最后，挤压过程中中心点的位置不变。
那么如何去求远平面”挤压”的变换矩阵呢，通过透视投影的侧视图如下

其中， $n$ 为近平面的 $Z$ 坐标，而 $z$ 为远平面 $Z$ 坐标，对于两个平面的 $Y$ 坐标来说，根据相似三角形我们知道有如下关系
$\Large{\frac{y^{\prime } }{y} = \frac{n }{z} \Rightarrow y^{\prime } = \frac{n }{z}y}$
因此，通过这个相似关系，我们也可以得出 $x^{\prime}$ 的坐标
$\Large{x^{\prime } = \frac{n }{z}x}$
到此，虽然我们根据这些条件无法计算得出 $z$ ，但我们根据回顾中的知识可以知道如下关系
${\Large \begin{bmatrix} x \\ y \\ z \\ 1 \end{bmatrix}\xrightarrow[]{} \begin{bmatrix} \frac{nx}{z}\\ \frac{ny}{z}\\ unknown\\ 1 \end{bmatrix}\overset{\times z}{\rightarrow} \begin{bmatrix} nx\\ ny\\ still~unknown\\ 1 \end{bmatrix}}$
因此，从透视变换到正交变换的矩阵表达为
${\Large M_{persp\rightarrow ortho}^{4\times 4} \begin{bmatrix} x \\ y \\ z \\ 1 \end{bmatrix}=\begin{bmatrix} nx\\ ny\\ still~unknown\\ 1 \end{bmatrix}}$
根据上边这个式子我们可以知道 $M_{persp\longrightarrow ortho}$ 矩阵的一些值
${\Large M_{persp\rightarrow ortho}= \begin{bmatrix} n& 0 & 0 & 0\\ 0& n & 0 & 0\\ ?& ? & ? & ?\\ 0& 0 & 1 &0 \end{bmatrix}}$
那么怎么将上边的矩阵第三行填满呢，根据前面透视投影的侧视图我们可以观察到以下两个点，根据这两个点我们可以填满出第三行
- 近平面的 $Z$ 坐标不变
- 远平面的 $Z$ 坐标也不变
首先，根据近平面的 $Z$ 坐标不变这一点我们可以将近平面坐标带入到透视投影到正交投影的变换的式子中
$\Large{ M_{persp\rightarrow ortho}^{4\times 4} \begin{bmatrix} x \\ y \\ z \\ 1 \end{bmatrix}=\begin{bmatrix} nx\\ ny\\ still~unknown\\ 1 \end{bmatrix}\Rightarrow M_{persp\rightarrow ortho}^{4\times 4}\begin{bmatrix} x\\ y\\ n\\ 1 \end{bmatrix}=\begin{bmatrix} nx\\ ny\\ n^{2}\\ n \end{bmatrix}}$
根据这个关系我们可以假设 $M_{persp\longrightarrow ortho}$ 的第三行为 $\begin{bmatrix} 0& 0 & A &B \end{bmatrix}$ ，因为最后的结果 $n^{2}$ 与 $x$ 、 $y$ 都没有关系，因此就有如下等式
${\Large \begin{bmatrix} 0& 0 & A &B \end{bmatrix}\begin{bmatrix} x\\ y\\ n\\ 1 \end{bmatrix} = n^{2} \Rightarrow An+B=n^{2}}$
其次，根据远平面的 $Z$ 坐标也不变这一点跟上边一样构造等式，这次我们取远平面的中心点 $\begin{bmatrix} 0\\ 0\\ f\\ 1 \end{bmatrix}$ 作为特殊点带入到公式中
$\Large{ \begin{bmatrix} 0\\ 0\\ f\\ 1 \end{bmatrix}=\begin{bmatrix} 0\\ 0\\ f^{2}\\ f \end{bmatrix}\Rightarrow Af+B=f^{2}}$
综上两个等式，组成方程组即可求出 $A$ 和 $B$ 的值
$\Large{ \begin{cases} An+B=n^{2}\\ Af+B=f^{2} \end{cases}\Rightarrow \begin{cases} A=n+f\\ B=-nf \end{cases} }$
由此，我们求出了整个透视投影到正交投影的变换矩阵
${\Large M_{persp\rightarrow ortho}= \begin{bmatrix} n& 0 & 0 & 0\\ 0& n & 0 & 0\\ 0& 0 & n+f & -nf\\ 0& 0 & 1 &0 \end{bmatrix}}$
而正交投影矩阵 $M_{ortho}$ 我们也已经知道通过 $M_{persp} = M_{ortho}M_{persp\rightarrow ortho}$ 即可求出最终的透视投影矩阵