透视矩阵的推导（最直观、最深入、最还原，看完请点赞。）

最新推荐文章于 2023-11-09 01:18:16 发布

置顶 hunterzone

最新推荐文章于 2023-11-09 01:18:16 发布

阅读量2w

点赞数 12

分类专栏： 3d几何 opengl 数学文章标签：透视投影矩阵推导直观深入

本文链接：https://blog.csdn.net/hunter_wwq/article/details/47025703

版权

3d几何同时被 3 个专栏收录

11 篇文章 3 订阅

订阅专栏

数学

11 篇文章 2 订阅

订阅专栏

opengl

4 篇文章 1 订阅

订阅专栏

由参数l,r,b,t,n,f定义的透视投影矩阵的推导困惑了我差不多一个多礼拜，这几天几乎是天天都在思考这个问题，昨天晚上3点多钟我突然醒了，然后我又开始想这个问题，结果终于让我给想通了，于是我赶紧起床把这个思路记在了草稿纸上，还专门照了张照片作证。
这里写图片描述
为了解决这个问题，前几天我专门发了两篇帖子求答案，结果知网上的竟然沉掉了。而在csdn上也没有得到答案（质疑有关透视投影矩阵的推导）。幸亏我自己还是解决了这个问题。
下面推导的是OpenGL中的透视投影矩阵。
已经知道由参数fovy,aspect,n,f定义的透视投影矩阵为：(有关这块的推导可见《3d graphics for game programming》 2.4.3 derivation of projection matrix，讲得非常详细)
$P_{OpenGL} =$ $\begin{pmatrix} \frac{cot(\frac{fovy}{2})}{aspect} & 0 & 0 & 0 \\ 0 & cot(\frac{fovy}{2}) & 0 & 0 \\ 0 & 0 & -\frac{f+n}{f-n} & -\frac{2nf}{f-n} \\ 0 & 0 & -1 & 0 \\ \end{pmatrix}$
那么再看另一种投影参数l,r,b,t,n,f，上面矩阵中：
$\frac{cot(\frac{fovy}{2})}{aspect} = cot(\frac{fovx}{2}) = \frac{2n}{r-l},$
$cot(\frac{fovy}{2}) = \frac{2n}{t-b}.$
因为参数l,r是对应视见空间中x轴的坐标，b,t对应视见空间中y轴的坐标，如果l=-r并且b=-t，那么由这种参数定义的透视投影矩阵就是：
$P’_{OpenGL} =$ $\begin{pmatrix} \frac{2n}{r-l} & 0 & 0 & 0 \\ 0 & \frac{2n}{t-b} & 0 & 0 \\ 0 & 0 & -\frac{f+n}{f-n} & -\frac{2nf}{f-n} \\ 0 & 0 & -1 & 0 \\ \end{pmatrix}$
而官方的透视投影矩阵是：
$P_{OpenGL} =$ $\begin{pmatrix} \frac{2n}{r-l} & 0 & \frac{r+l}{r-l} & 0 \\ 0 & \frac{2n}{t-b} & \frac{t+b}{t-b} & 0 \\ 0 & 0 & -\frac{f+n}{f-n} & -\frac{2nf}{f-n} \\ 0 & 0 & -1 & 0 \\ \end{pmatrix}$
实际上这个矩阵是由两步转换完成的，第一步是进行矩阵 $P'_{OpenGL}$ 变换，然后进行了平移操作，如下：

$P O p e n G L = T \times P' O p e n G L = ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ 100001000010 - r + l r - l - t + b t - b 01 ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ \times ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ 2 n r - l 000 0 2 n t - b 00 00 - f + n f - n - 1 00 - 2 n f f - n 0 ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ = ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ 2 n r - l 000 0 2 n t - b 00 r + l r - l t + b t - b - f + n f - n - 1 00 - 2 n f f - n 0 ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟$ $\begin{align} P_{OpenGL} & = T×P'_{OpenGL} \\ & = \begin{pmatrix} 1 & 0 & 0 & -\frac{r+l}{r-l} \\ 0 & 1 & 0 & -\frac{t+b}{t-b} \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \\ \end{pmatrix} × \begin{pmatrix} \frac{2n}{r-l} & 0 & 0 & 0 \\ 0 & \frac{2n}{t-b} & 0 & 0 \\ 0 & 0 & -\frac{f+n}{f-n} & -\frac{2nf}{f-n} \\ 0 & 0 & -1 & 0 \\ \end{pmatrix} \\ & = \begin{pmatrix} \frac{2n}{r-l} & 0 & \frac{r+l}{r-l} & 0 \\ 0 & \frac{2n}{t-b} & \frac{t+b}{t-b} & 0 \\ 0 & 0 & -\frac{f+n}{f-n} & -\frac{2nf}{f-n} \\ 0 & 0 & -1 & 0 \\ \end{pmatrix} \end{align}$
那些说这个透视投影没有做平移这一步操作，我可以100%跟你说你是错的！
下面我来解释为什么进行了平移操作。
来张示意图：

这个是视见空间中的示意图，因为存在l≠-r或b≠-t的情况，所以这里我故意没把近裁剪平面中心画在z轴上。 示意图上由红线绘制的立方体才是由l,r,b,t,n,f参数定义的视锥体，其中远裁剪平面上的四个点分别对应原点eye经过近裁剪平面上四个点的延长线与z=-f平面的交点，注意这个视锥体是不规则的！然后图中的标注l’, r’是近裁剪平面点(l,b,-n)和点(r,b,-n)x轴上的分量在 $z=-cot(\frac{fovx}{2})$ 上的投影， $l'=\frac{2l}{r-l}$ ， $r'=\frac{2r}{r-l}$ ，l’和r’的中心值是 $\frac{r+l}{r-l}$ ，同理近裁剪平面上点(r,b,-n)和点(r,t,-n)y轴上的分量在 $z=-cot(\frac{fovy}{2})$ 上的投影， $b'=\frac{2b}{t-b}$ ， $t'=\frac{2t}{t-b}$ ，b’和t’的中心值是 $\frac{t+b}{t-b}$ 。图中的视锥体通过 $P'_{OpenGL}$ 透视变换之后得到的是规则的正方体（左下角顶点 $(\frac{2l}{r-l},\frac{2b}{t-b},1)$ ，右上角顶点 $(\frac{2r}{r-l},\frac{2t}{t-b},-1)）$ ，最终要把它转换成cvv（canonical view volume，正规可视化空间），则需要进行T平移转换，也就是平移 $(-\frac{r+l}{r-l}, -\frac{t+b}{t-b}, 0)$ 。得证。

确定要放弃本次机会？
福利倒计时
: :

立减 ¥
普通VIP年卡可用
立即使用

hunterzone

关注关注

12
点赞

踩

38

收藏

觉得还不错? 一键收藏

11
评论

复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

透视投影变换矩阵推导学习笔记

bleachpingzi的专栏

07-03 2092

最近在研究透视投影，Twinsen大神的神贴有非常详细的推导过程(传送门)，这里做一下学习笔记。首先是两点基础的原理： 1.P经过矩阵M变换后得到P’点，如果知道P(x,y,z)和变换后的P’(x’,y’,z’)，只要P’点的各个分量x’,y’,z’可以表示成原分量x,y,z的线性表示，那么就可以反推出变换矩阵M。如P(x,y,z)，变换后的P’(2x+3y,7z,x+2y+3z)，则可

透视投影详解

weixin_34233421的博客

07-25 1159

概述投影变换完成的是如何将三维模型显示到二维视口上，这是一个三维到二维的过程。你可以将投影变换看作是调整照相机的焦距，它模拟了为照相机选择镜头的过程。投影变换是所有变换中最复杂的一个。视锥体视锥体是一个三维体，他的位置和摄像机相关，视锥体的形状决定了模型如何从camera space投影到屏幕上。最常见的投影类型-透视投影，使得离摄像机近的物体投影后较大，而离摄像机较远的物体投影后较小...

11 条评论您还未登录，请先登录后发表或查看评论

D3D透视投影矩阵推导

02-21

D3D透视投影矩阵推导所谓透视投影矩阵就是为了让画面呈现近大远小的效果

透视投影矩阵的推导过程

04-28

透视投影矩阵的推导过程。如果您想征服图形学中的这匹野马的话，这个文件可能是您所需要的

透视投影矩阵的推导

weixin_34214500的博客

03-14 407

视锥体如图，近截面与远截面之间构成的这个四棱台就是视锥体，而透视投影矩阵的任务就是把位于视锥体内的物体的顶点X,Y,Z坐标映射到[-1,1]范围。这就相当于把这个四棱台扭曲变形成一个立方体。这个立方体叫做规则观察体(CanonicalViewVolume,CVV)。如下图：变换方法或规则：如下图，有一点P，位于视锥体内，设坐标为(x,y,z).分别对x...

Opengl_10_透视投影

weixin_30478757的博客

01-26 223

1，We have finally reached the item that represents 3D graphics best - the projection from the 3D world on a 2D plane while maintaining the appearance of depth. A good example is a picture of a road or...

透视投影矩阵推导

木·本的博客

05-10 9090

透视投影矩阵（Perspective Matrix）近截面与远截面之间构成的四棱台称为视锥体，而透视投影矩阵的任务就是把位于视锥体内的物体的顶点 x,y,zx,y,zx,y,z 坐标映射到 [−1,1][-1,1][−1,1] 范围。这相当于把这个四棱台扭曲变形成一个立方体。这个立方体叫做规范观察体（Canonical View Volume, CVV）。矩阵的形式 (1aspect⋅tan⁡(fovy2)00001tan⁡(fovy2)0000−zNear−zFarzNear−zFar2⋅zNea

7. 透视投影矩阵

weixin_33971977的博客

01-08 245

#include<d3d9.h>#include<d3dx9.h>#pragma comment(lib, "d3d9.lib")#pragma comment(lib, "d3dx9.lib")#define WINDOW_CLASS "UGPDX"#define WINDOW_NAME "Perspective Projection Matrix"#d

图形学中透视投影矩阵推导

m0_65786768的博客

12-23 854

透视矩阵

「图形学/渲染管线/图元装配」透视投影矩阵的推导和原理解释

01-06

文章目录前言前置知识视见体和标准设备坐标系透视投影原理目的/结果透视投影矩阵的推导1. 计算视锥体的点投影到近平面的x、y坐标2. 规范化近投影面的x、y坐标3. 透视除法消除非线性变换4. 计算视锥体的点投影后的...

图像处理之逆透视变换.rar_图像处理_图像逆透视_逆透视_逆透视矩阵_透视变换原理

07-13

逆透视变换的数学原理，在文档中有详细的逆透视变换的矩阵推导过程，但是没有代码，opencv逆透视变换代码可以看我发的另一篇资源。。。。。。。。。。。。。。。。。。

透视投影(Perspective_Projection)变换推导

所学、所思、所悟——coderling

01-21 2506

原文作者我也不知道是谁。。偶尔在论坛上看到，然后搜了一下，在百度文库下了个文档。不管怎样，感谢原作者的辛勤劳动。 透视投影是3D固定流水线的重要组成部分，是将相机空间中的点从视锥体(frustum)变换到规则观察体(Canonical View Volume)中，待裁剪完毕后进行透视除法的行为。在算法中它是通过透视矩阵乘法和透视除法两步完成的。

Unity Shader 图形学,透视投影矩阵,正交投影矩阵的原理及推导,最直观地理解矩阵的意义

最新发布

qq_58047420的博客

11-09 733

Unity Shader 图形学,透视投影矩阵,正交投影矩阵的原理及推导,最直观地理解矩阵的意义

webgl学习之路（三）——透视投影矩阵的推导过程

mmmMMM12345的博客

07-01 1068

关于透视投影矩阵的讲解，网上有不少教程，但是有一点大家基本上都没有讲清楚：就是z轴坐标（这里的Z轴相当于景深）的推导过程，基本上是一笔带过。下面先从头开始讲推导过程，再慢慢说Z轴的推导过程。 透视投影如下图： 透视投影的过程如下：所观察的物体在一个半截面的方锥形中，设坐标为P，将P投影到近截面上，坐标为P’；如下图：推导P'很简单，就是几何概念相似三角形，推导过程如下图：大家注意，P’处的Z'坐标就是从视点O到近截面的距离。但是大家可以考虑这样一个问题：那所有的物体在近截面的

对透视投影矩阵的推导的总结

Du_Shuang的博客

06-21 1954

https://blog.csdn.net/cbbbc/article/details/51296804https://www.cnblogs.com/bluebean/p/5276111.html老样子给出来个链接，上面两位老哥写的已经非常好了，我也就不在啰嗦了。写这篇博客也是方便复习，避免忘记了又得重找资料。这里只做个总结透视投影矩阵变换就是将视锥体变换为一个长宽高都是-1到1范围内的正方...

透视投影变换矩阵推导过程

05-28

透视投影变换矩阵的推导过程如下：假设有一个三维点 $(X,Y,Z)$，它在相机坐标系中的坐标为 $(X_c,Y_c,Z_c)$。相机坐标系的原点为相机位置，$Z_c$ 轴指向相机朝向的反方向，$X_c$ 和 $Y_c$ 轴分别与相机的右方向和下方向对齐。为了把相机坐标系中的点映射到图像平面上，我们需要进行透视投影变换。首先，我们将相机坐标系中的点转换为齐次坐标 $(X_c,Y_c,Z_c,1)$。然后，我们将它乘以一个投影矩阵 $P$，得到一个新的齐次坐标 $(u,v,w,1)$： $$ \begin{bmatrix} u \\ v \\ w \\ 1 \\ \end{bmatrix} = P \cdot \begin{bmatrix} X_c \\ Y_c \\ Z_c \\ 1 \\ \end{bmatrix} $$ 其中，$u$ 和 $v$ 分别表示图像平面上的坐标，$w$ 用来进行透视除法，保证 $u$ 和 $v$ 的值在图像平面上。投影矩阵 $P$ 可以分解为相机内参矩阵 $K$ 和相机外参矩阵 $[R|t]$ 的乘积： $$ P = K [R|t] $$ 其中，$K$ 是一个 $3 \times 3$ 的矩阵，包含了相机的内部参数，如焦距、主点等。$[R|t]$ 是一个 $3 \times 4$ 的矩阵，包含了相机的外部参数，如相机的旋转和平移。为了推导 $P$ 的具体形式，我们可以先考虑一个简单的情况：相机坐标系的原点与图像平面重合，且相机的朝向与图像平面平行。这种情况下，投影矩阵可以表示为： $$ P = \begin{bmatrix} f & 0 & 0 & 0 \\ 0 & f & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \\ \end{bmatrix} $$ 其中，$f$ 是焦距，表示相机到图像平面的距离。当相机坐标系的原点和图像平面不重合时，我们可以使用相机外参矩阵 $[R|t]$ 来把相机坐标系的原点变换到图像平面上。具体来说，我们可以将相机坐标系的原点变换为 $(X_c',Y_c',Z_c')$，其中 $(X_c',Y_c',0)$ 是图像平面上的点。这个变换可以表示为： $$ \begin{bmatrix} X_c' \\ Y_c' \\ Z_c' \\ 1 \\ \end{bmatrix} = [R|t] \cdot \begin{bmatrix} 0 \\ 0 \\ 0 \\ 1 \\ \end{bmatrix} $$ 然后，我们可以把 $(X,Y,Z)$ 变换为 $(X',Y',Z')$，其中 $(X',Y')$ 是图像平面上的坐标。这个变换可以表示为： $$ \begin{bmatrix} X' \\ Y' \\ Z' \\ 1 \\ \end{bmatrix} = [R|t] \cdot \begin{bmatrix} X \\ Y \\ Z \\ 1 \\ \end{bmatrix} $$ 最后，我们可以将 $(X',Y',Z')$ 投影到图像平面上，得到一个新的齐次坐标 $(u,v,w,1)$。这个投影可以表示为： $$ \begin{bmatrix} u \\ v \\ w \\ 1 \\ \end{bmatrix} = K \cdot \begin{bmatrix} X'/Z' \\ Y'/Z' \\ 1 \\ \end{bmatrix} $$ 将以上三个变换组合起来，我们可以得到透视投影变换矩阵的形式： $$ P = K [R|t] = \begin{bmatrix} f_x & 0 & c_x & 0 \\ 0 & f_y & c_y & 0 \\ 0 & 0 & 1 & 0 \\ \end{bmatrix} \begin{bmatrix} r_{11} & r_{12} & r_{13} & t_1 \\ r_{21} & r_{22} & r_{23} & t_2 \\ r_{31} & r_{32} & r_{33} & t_3 \\ \end{bmatrix} $$ 其中，$f_x$ 和 $f_y$ 是 $K$ 矩阵的对角线元素，分别表示 $x$ 和 $y$ 方向上的焦距；$c_x$ 和 $c_y$ 是 $K$ 矩阵的中心点，表示图像平面上的主点；$r_{ij}$ 和 $t_i$ 是 $[R|t]$ 矩阵的元素，表示相机的旋转和平移。