透视投影矩阵推导

最新推荐文章于 2022-10-03 00:35:30 发布

木·本

最新推荐文章于 2022-10-03 00:35:30 发布

阅读量1w

点赞数 28

分类专栏： OpenGL 笔记文章标签： opengl 图形学 webgl

本文链接：https://blog.csdn.net/qq_43758883/article/details/116503614

版权

笔记同时被 2 个专栏收录

15 篇文章

订阅专栏

OpenGL

5 篇文章

订阅专栏

本文详细介绍了透视投影矩阵在OpenGL中的作用，它是将三维空间的物体映射到规范化观察体的过程，涉及透视变换、近截面与远截面、FOV、宽高比等参数。通过矩阵运算，将棱台观察体内的点转换到[-1,1]的范围内，形成具有真实感的透视效果。同时，文章还涵盖了平行投影与透视投影的区别，以及透视投影的数学推导和代码实现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

透视投影矩阵（Perspective Projection Matrix）的作用是进行规范化透视投影变换，即观察空间 $\rightarrow$ 规范化观察空间。

在OpenGL中，传给 projectionMatrix 的值：

gl_Position = projectionMatrix * modelViewMatrix * vec4(position, 1.0);

在这里插入图片描述
近截面与远截面之间构成的四棱台称为棱台观察体，而透视投影矩阵的任务就是把位于观察体内的物体的顶点 $x, y, z$ 坐标映射到 $[- 1, 1]$ 范围。这相当于把这个四棱台扭曲变形成一个立方体。这个立方体叫做规范化观察体（Normalized View Volume）。
在这里插入图片描述

矩阵的形式

在投影中心位于原点且观察平面在近裁剪平面位置时，有
$M_{pers,norm}=\begin{pmatrix} \frac{1}{aspect\cdot\tan(\frac{fovy}{2})} & 0 &0&0\\ 0&\frac{1}{\tan(\frac{fovy}{2})}&0&0\\ 0&0&\frac{zNear+zFar}{zNear-zFar}&\frac{2\cdot zNear\cdot zFar}{zNear-zFar}\\ 0&0&-1&0\\ \end{pmatrix}$

其中的 $\frac{1}{\tan(\frac{fovy}{2})}$ 可化为 $\cot(\frac{fovy}{2})$

参数

fovy ：摄像机垂直方向的 FOV（Field of View，视场角），相机可以接收影像的角度范围，也可以称为视野；
aspect ：裁剪平面的宽高比；
zNear ：摄像机与近裁剪平面的距离；
zFar ：摄像机与远裁剪平面的距离。

三维观察流水线

在这里插入图片描述

投影变换

对象描述变换到观察坐标后，下一阶段是将其投影到观察平面上。图形软件一般都支持平行投影和透视投影两种方式。

在平行投影(parallel projection)中，坐标位置沿平行线变换到观察平面上。下图给出了用端点坐标 $P_1$ 和 $P_2$ 描述的线段的平行投影。平行投影保持对象的有关比例不变，这是三维对象计算机辅助绘图和设计中产生成比例工程图的方法。场景中的平行线在平行投影中显示成平行的。一般有两种获得对象平行视图的方法:沿垂直于观察平面的直线投影，或沿某倾斜角度投影到观察平面。
在透视投影（perspective projection）中，对象位置沿 会聚到观察平面后一点的直线 变换到投影坐标系。下图给出了使用端点坐标 $P_1$ 和 $P_2$ 描述的线段的透视投影。与平行投影不同的是，透视投影不保持对象的相关比例。但场景的透视投影真实感较好，因为在透视显示中较远的对象减小了尺寸。

（本文只讨论透视投影）
在这里插入图片描述

正投影

有些图形软件包使用单位立方体作为规范化观察体，其x、y和z坐标规范在0到1之间。另外的规范化变换方法是使用坐标范围从-1到1的对称立方体。

由于屏幕坐标经常指定为左手系（参见下图），因此规范化观察体也常指定为左手系统。这样就可以将观察方向的正距离解释为离屏幕（观察平面）的距离。因此，可以将投影坐标转换为左手坐标系中的位置，并进一步由观察变换转换为左手屏幕坐标。
在这里插入图片描述

透视投影

当透视投影观察体是一个对称棱台时，透视变换将棱台内部的位置映射到矩形平行管道中的正交投影坐标。由于棱台中心线已经和观察平面垂直（参见下图），故平行管道的中心线就是棱台的中心线。这是棱台中所有投影线上的位置映射到观察平面上同一点 $x_p,y_p)$ 的结果。因此，每一投影线由透视变换转换成正交观察平面的线条时，因而平行于棱台的中心线。

使用转换到正交投影观察体后的对称棱台，可以进入下一步的规范化化变换。
在这里插入图片描述

透视投影将棱台观察体中的所有点变换成矩形平行管道观察体中的位置。透视变换过程的最后一步是将该平行管道映射到规范化观察体（normalized view volume）中。
在这里插入图片描述
规范化透视投影变换分两步进行：

将棱台观察体中的所有点变换成矩形平行管道观察体中的位置；
将该平行管道映射到规范化观察体中。

变换方法或规则

设有一点P，位于观察体内，其坐标为 $(x, y, z)$ ，分别对x、y坐标和z坐标变换到 $[- 1, 1]$ 内的方式进行讨论：

x、y坐标的变换方式：

1、视点（投影中心或投影参考点）与P点的连线与近裁剪面（即裁剪窗口）交于P’点；
2、设近裁剪面的宽度为W，高度为H，P’点的x坐标范围是 $[-\frac{W}{2},\frac{W}{2}]$ ，y坐标范围是 $[-\frac{H}{2},\frac{H}{2}]$ ，然后分别映射至 $[- 1, 1]$ 内。

z坐标的变换方式

z坐标的范围是 $z N e a r$ 至 $z F a r$ ，需要映射到 $[- 1, 1]$ ，映射方法待定。

变换步骤

在获得世界中某一点 $p(x_w, y_w,z_w)$ 在视点坐标系下的坐标 $p(x_v, y_v,z_v)$ 后，将其坐标进行规范化投影变换，即使得位于视锥体内的点的坐标 $z\in [-1, 1]$

1. 将棱台观察体中的所有点变换成矩形平行管道观察体中的位置

先计算出它在 近裁剪平面 上的投影坐标的 $x_v', y_v'$ 值

对y方向
$\frac{y_v'}{- zNear}=\frac{y_v}{z_v}\\ y_v'=-\frac{y_v\cdot zNear}{z_v}$
对x方向
$\frac{x_v'}{-zNear}=\frac{x_v}{z_v}\\ x_v'=-\frac{x_v\cdot zNear}{z_v}$
对z方向
z的坐标不变
$z^{'} = z$

2. 将该平行管道映射到规范化观察体中

有近裁剪平面到投影中心或投影参考点的距离 zNear 和垂直方向上的视场角 fovy ，故可求得裁剪窗口的宽 $W$ 和高 $H$ ：

$\frac{H}{2}=zNear\cdot \tan(\frac{fovy}{2})$

$\because aspect=\frac{W}{H} （视口的宽高之比）$

$\therefore W=H\cdot aspect$

$\frac{W}{2}=aspect\cdot zNear\cdot \tan(\frac{fovy}{2})$

再由 近裁剪平面 上的投影坐标的 $x_v', y_v'$ 值求出其规范化坐标的 $x_v'', y_v''$ 值：
$y_v''=\frac{y_v'}{\frac{H}{2}}\\ y_v''=\frac{y_v'}{zNear\cdot \tan(\frac{fovy}{2})}\\ y_v''=-\frac{y_v}{z_v\cdot \tan(\frac{fovy}{2})}\\$
$x_v''=\frac{x_v'}{\frac{W}{2}}\\ x_v''=\frac{x_v'}{aspect\cdot zNear\cdot \tan(\frac{fovy}{2})}\\ x_v''=-\frac{x_v}{z_v\cdot aspect\cdot \tan(\frac{fovy}{2})}$
此处暂未确定其规范化坐标的 $z^{''}$ 的值。
此时写出 $p$ 点的规范化投影坐标，如下：
$p''(-\frac{x_v}{z_v\cdot aspect\cdot \tan(\frac{fovy}{2})},-\frac{y_v}{z_v\cdot \tan(\frac{fovy}{2})},z_v'')$
$p^{''}$ 的齐次坐标：
$p''(-\frac{x_v}{z_v\cdot aspect\cdot \tan(\frac{fovy}{2})},-\frac{y_v}{z_v\cdot \tan(\frac{fovy}{2})},z_v'',1)$
对 $p^{''}$ 的齐次坐标中的每一位都乘以 $z_v$ ：
$p''(\frac{x_v}{aspect\cdot \tan(\frac{fovy}{2})},\frac{y_v}{\tan(\frac{fovy}{2})},-z_v''\cdot z_v,-z_v)$
由此可以确定透视投影矩阵的部分内容：
$\begin{pmatrix} \frac{1}{aspect\cdot\tan(\frac{fovy}{2})} & 0 &0&0\\ 0&\frac{1}{\tan(\frac{fovy}{2})}&0&0\\ 0&0&a&b\\ 0&0&-1&0\\ \end{pmatrix}\cdot\begin{pmatrix} x_v\\ y_v\\ z_v\\ 1 \end{pmatrix}$
其中 $a$ 、 $b$ 的值待定。
$a\cdot z_v+b=-z_v''\cdot z_v\\$
同除 $z_v$
$\Rightarrow -a-\frac{b}{z_v}=z_v''$

当 $z_v=-zNear$ 时， $z_v''=-1\Rightarrow -a-\frac{b}{-zNear}=-1$
当 $z_v=-zFar$ 时， $z_v''=1\Rightarrow -a-\frac{b}{-zFar}=1$

解出
$a=\frac{zNear+zFar}{zNear-zFar}\\$
$b=\frac{2\cdot zNear\cdot zFar}{zNear-zFar}\\$

故
$M_{pers}=\begin{pmatrix} \frac{1}{aspect\cdot\tan(\frac{fovy}{2})} & 0 &0&0\\ 0&\frac{1}{\tan(\frac{fovy}{2})}&0&0\\ 0&0&\frac{zNear+zFar}{zNear-zFar}&\frac{2\cdot zNear\cdot zFar}{zNear-zFar}\\ 0&0&-1&0\\ \end{pmatrix}$

代码实现

OpenGL中的矩阵是以列为主标记次序。

如果以行主序存储该矩阵，在内存中的布局如下图所示：

行主序矩阵

如果以列主序存储该矩阵，在内存中的布局如下图所示：

列主序矩阵

行主序与列主序只是矩阵不同的存储形式，由它们表示的矩阵在数学意义上是全等的，这对矩阵的算法和矩阵的操作结果是没有影响的。

mat4x4 perspective(
	float const & fovy, 
	float const & aspect, 
	float const & zNear, 
	float const & zFar
) 
{
    const float tanHalfFOV = tanf(ToRadian(fovy / 2.0f));

	mat4x4 Result;

    Result[0][0] = 1.0f / (tanHalfFOV * aspect);                   
    Result[1][1] = 1.0f / tanHalfFOV;           
    Result[2][2] = - (zNear + zFar) / (zFar - zNear);
	Result[2][3] = - 1.0f;
	Result[3][2] = - (2.0f * zFar * zNear) / (zFar - zNear);
    
	return Result;
}

延申：

将棱台观察体中的所有点变换成矩形平行管道观察体中的位置，有矩阵 $M_{pers\rightarrow ortho}$
将该平行管道映射到规范化观察体中（与平行投影的规范化变换相同），则有矩阵 $M_{ortho,norm}$

此时有
$M_{pers,norm}=M_{ortho,norm}\cdot M_{pers\rightarrow ortho}$