【计算机图形学基础】投影矩阵

lyzirving

已于 2022-09-18 11:41:44 修改

阅读量3.2k

点赞数 6

分类专栏：计算机图形文章标签：图形渲染线性代数

于 2022-07-20 00:59:17 首次发布

本文链接：https://blog.csdn.net/lyzirving/article/details/125860578

版权

计算机图形专栏收录该内容

6 篇文章

订阅专栏

最近在重温计算机图形学的基础知识，期望能做到温故知新，加深对其的理解，以便能从容应对工作中各种情况。
小弟水平有限，若有不正确之处，欢迎大家批评指正。
相关文章链接：
【计算机图形学基础】线性代数基础1
【计算机图形学基础】线性代数基础2
【计算机图形学基础】相机矩阵
 【计算机图形学基础】投影矩阵
 【计算机图形学基础】光照模型和着色频率
 【计算机图形学基础】阴影映射

1 投影矩阵的作用

投影分为正交投影和透视投影。
正交投影会保留场景原始的画面，平行的线仍然平行；
透视投影会产生近大远小的效果，平行的线不再平行。
投影矩阵将相机空间的顶点全部转换到裁剪空间，裁剪空间的点处于齐次坐标系中，x, y和z除以齐次坐标后，值范围为[-1, 1]。
齐次坐标转换到笛卡尔坐标后，才能进行视口变换，如下所示：

$\begin{pmatrix}x \\ y \\ z \\ w\end{pmatrix}$ ----> $\begin{pmatrix}\frac{x}{w} \\ \frac{y}{w} \\ \frac{z}{w} \\ 1\end{pmatrix}$ ----> $\begin{pmatrix}\frac{x}{w} \\ \frac{y}{w} \\ \frac{z}{w}\end{pmatrix}$

2 正交投影

2.1 视景体

正交投影的视景体如下图所示：

该视景体是一个立方体，在 $x yz$ 组成的的相机空间中；
l 代表视景体左截面x坐标，r 代表视景体右截面x坐标；
b 代表视景体底截面y坐标，t 代表视景体上截面y坐标；
n 代表视景体近截面z坐标，f 代表视景体远截面z坐标；
视景体中，l 一定小于 r，b 一定小于 t。相机空间中，可视点的 z 值一定小于0，所以 n 一定大于 f。

2.2 正交投影变换

正交投影变换包含两个步骤：
① 将视景体中心平移到原点；
② 执行缩放，使 xyz的范围为[-1, 1]。

上述变换要分别使用平移矩阵 $M_{T}$ 和缩放矩阵 $M_{S}$ 。
平移矩阵如下：

$M_{T}$ = $\begin{pmatrix}1 & 0 & 0 & -\frac{(l+r)}{2}\\0 & 1 & 0 &-\frac{(b+t)}{2}\\0 & 0 & 1 & -\frac{(n+f)}{2}\\0 & 0 & 0& 1\end{pmatrix}$

缩放矩阵如下：

$M_{S}$ = $\begin{pmatrix}\frac{2}{r-l} & 0 & 0 & 0\\0 &\frac{2}{t-b} & 0 & 0\\0 & 0 & \frac{2}{n-f} &0\\0 & 0 & 0& 1\end{pmatrix}$

现以 x 为例来推导缩放因子。
平移视景体中心到原点后，由于视景体是对称的立方体，所以 $- n < x < n$ ，其中n > 0，且 n = $\frac{l+r}{2}$ = $\frac{r-l}{2}$ 。
为了让 $- 1 < x < 1$ ，因此需要乘以系数 $\frac{1}{n}$ ，即 $\frac{2}{r-l}$ 。
其他两个维度的推导也是如此。
综上，正交投影矩阵 $M_{Ortho}$ = $M_{S}$ $M_{T}$ 。

结果如下： $M_{Ortho}$ = $\begin{pmatrix}\frac{2}{r-l} & 0 & 0 & -\frac{r+l}{r-l} \\ 0 & \frac{2}{t-b} & 0 & -\frac{t+b}{t-b} \\ 0 & 0 & \frac{-2}{f-n} & -\frac{f+n}{f-n} \\ 0 & 0 & 0 & 1 \end{pmatrix}$

注意，如果视景体的aspect ratio != 1，经过正交变换后，图像会被拉伸。最后，会通过视口变换进行纠正。

3 透视投影

透视投影是应用最广泛的投影，它能产生近大远小的效果，平行线经过透视投影后不再平行。

3.1 视椎体

同正交投影一样，透视投影也有自己的l、r、b、t、n、f。不同的是，各个截面会相交于相机空间的原点。
视椎体中的顶点被投影到近平面上，从而被渲染到屏幕。

3.2 决定视椎体的因素

视椎体由如下因素决定：① field of view；② aspect ration；③ near 和 far。
fovy和aspect ratio
视椎体是个对称的平截头体，现以侧面YZ平面来分析：
在这里插入图片描述
现在已知fovY、apsect ratio = $\frac{width}{height}$ 、near和far，视椎体是一个对称平截头体，且规则地放在 $- Z$ 轴上。
根据正切定理，有 t = $tan(\frac{fovY}{2})$ * $∣ n ∣$ ；又根据对称性，得到 -t = b；
又根据 aspect ratio = $\frac{r}{t}$ = $\frac{width}{height}$ ，因此 r = aspect ratio * t；又因为对称性，所以有 -r = l。
综上，可根据fovY、aspect ration、near 和 far可求得 l、r、b 和 t。

3.3 透视投影矩阵

3.3.1 相似变换

以侧面 YZ 面来进行分析：
在这里插入图片描述
由相似三角形，点投影到近平面后，其 $y^{'}$ = $\frac{|n|}{|z|}$ * $y$ ；
同理，该点的x轴坐标为 $x^{'}$ = $\frac{|n|}{|z|}$ * $x$ 。
在OpenGL中，通常near和far必须指定为大于0，因此，由于 $z < 0$ ，有：
$x^{'}$ = $-\frac{n}{z}$ * $x$ ， $y^{'}$ = $-\frac{n}{z}$ * $y$ 。

3.3.2 推导影响x、y分量的元素

$x$ 经过投影后成为 $x^{'}$ ， $x^{'}$ 在近平面上，因此有： $l < x^{'} < r$ ；

减去 l，有： $0 < x^{'} - l < r - l$ ；

除以 $r - l$ ，有： $\frac{x' - l}{r - l} < 1$ ；

乘以2，有： $2\frac{x' - l}{r - l} < 2$ ；

减去1，有： $2\frac{x' - l}{r - l} - 1< 1$ ；

将上述等式优化，有： $\frac{2x' - 2l}{r - l} - \frac{r-l}{r-l}< 1$ ；

有： $\frac{2x' - l - r}{r - l}< 1$ ；

有： $\frac{2x'}{r - l} - \frac{r+l}{r-l}< 1$ ；

将上述 $x^{'}$ 替换为 $x$ (相机空间坐标点)，有： $\frac{-2nx}{z(r - l)} - \frac{r+l}{r-l}< 1$ ； (等式①)

因此，若将下述矩阵作为透视变换矩阵，有：

$M_{Perspect}$ = $\begin{pmatrix}\frac{2n}{r-l} & 0 & \frac{r+l}{r-l} & 0\\... & ... & ... & ...\\... & ... & ... & ...\\0 & 0 & -1 & 0\end{pmatrix}$

现求取 $x$ 分量进行验证， $M_{Perspect}$ x $\begin{pmatrix}x \\y \\z \\w \end{pmatrix}$ ，该结果的 $x$ 分量为： $\frac{2n}{r-l}x$ + $\frac{r+l}{r-l}z$ ；

该结果的 $w$ 分量(齐次坐标)为： $0 * x$ + $0 * y$ + $(- 1 * z)$ + $0 * w$ = $- z$ ；

齐次坐标转换为笛卡尔坐标需要除以 $w$ ，故上述 $x$ 分量转换到笛卡尔坐标后为： $\frac{2nx}{-z(r-l)}$ - $\frac{r+l}{r-l}$ 。该值和前述推导等式①一致。

综上，透视投影矩阵的第一行元素就确定下来了。
同理，可以确定透视投影的第二行元素，其推导方法和前述一致，只是把 $r$ 和 $l$ 分别替换为 $t$ 和 $b$ 。

$M_{Perspect}$ = $\begin{pmatrix}\frac{2n}{r-l} & 0 & \frac{r+l}{r-l} & 0\\ 0 & \frac{2n}{t-b} & \frac{t+b}{t-b} & 0\\... & ... & ... & ...\\0 & 0 & -1 & 0\end{pmatrix}$

3.3.3 推导影响z分量的元素

投影后的点在近平面上， $x$ 和 $y$ 不会对 $z$ 有影响，那么设透视投影矩阵为：

$M_{Perspect}$ = $\begin{pmatrix}\frac{2n}{r-l} & 0 & \frac{r+l}{r-l} & 0\\ 0 & \frac{2n}{t-b} & \frac{t+b}{t-b} & 0\\0 & 0 & A & B\\0 & 0 & -1 & 0\end{pmatrix}$

其中 A 和 B 是待求解的未知数。

有： $z^{'}$ = ( $A z + Bw$ ) / ( $- z$ )；

其中 $A z + Bw$ 表示进行投影变换，此时点处于裁剪空间。

( $A z + Bw$ ) / ( $- z$ ) 表示将裁剪空间转换到NDC。

当相机空间的点在近平面时， $z^{'}$ 需要被投影为-1，且此时 $z$ = -near；
当相机空间的点在远平面时， $z^{'}$ 需要被投影为1，且此时 $z$ = -far；

因此，可以列出两个方程：

① $- 1$ = $\frac{-nA + B}{n}$ ；

② $1$ = $\frac{-fA + B}{f}$ ；

两个方程，两个未知数，解得 $A$ = $-\frac{f+n}{f-n}$ ， $B$ = $-\frac{2fn}{f-n}$ 。

综上，透视投影的方程如下：

$M_{Perspect}$ = $\begin{pmatrix}\frac{2n}{r-l} & 0 & \frac{r+l}{r-l} & 0\\ 0 & \frac{2n}{t-b} & \frac{t+b}{t-b} & 0\\0 & 0 & -\frac{f+n}{f-n} & -\frac{2fn}{f-n}\\0 & 0 & -1 & 0\end{pmatrix}$

4 投影矩阵之后

4.1 裁剪空间

相机空间中的顶点应用了投影矩阵后，便进入了裁剪空间，其中 $w_{clip}$ 即齐次坐标：

$\begin{pmatrix}x_{clip} \\ y_{clip} \\ z_{clip} \\ w_{clip} \end{pmatrix}$ = $M_{projection} \begin{pmatrix}x_{cam} \\ y_{cam} \\ z_{cam} \\ w_{cam} \end{pmatrix}$

4.2 NDC

进入裁剪空间的点，被齐次坐标相除。此后，顶点被转变到笛卡尔坐标中。此时的坐标空间被称为标准设备坐标系(NDC)。如下所示：

$\begin{pmatrix}x_{ndc} \\ y_{ndc} \\ z_{ndc}\end{pmatrix}$ = $\begin{pmatrix}x_{clip} / w_{clip} \\ y_{cam} / w_{clip} \\ z_{cam} / w_{clip}\end{pmatrix}$

在NDC中，三轴的坐标值被转换到 [-1, 1] 中。

4.3 视口变换

NDC的坐标经过视口变换(viewport transformation)后，能得到每个顶点在屏幕空间的坐标。
视口变换中，NDC坐标将会被缩放、平移，从而去匹配渲染屏幕。最后，屏幕空间坐标将会被用于光栅化。
屏幕空间的原点在视口左下角，+x水平向右，+y水平向上。
假如有屏幕空间原点( $x_{o}$ , $y_{o}$ )，窗口的宽度 $w$ 和高度 $h$ ，转换如下：

$\begin{pmatrix}x_{w} \\ y_{w}\\ z_{w}\end{pmatrix}$ = $\begin{pmatrix}\frac{w}{2} x_{ndc} + (x_{o} + \frac{w}{2})\\ \frac{h}{2} y_{ndc} + (y_{o} + \frac{h}{2}) \\z_{ndc}\end{pmatrix}$