(十四)透视变换

透视变换(Perspective Transformation)

一 图像变换与平面坐标系的关系

1、旋转:

在这里插入图片描述

2、平移:

在这里插入图片描述在这里插入图片描述

3、刚体变换

在这里插入图片描述

4、仿射变换

在这里插入图片描述
在这里插入图片描述在这里插入图片描述

5、投影变换(单应性变换)

在这里插入图片描述

6 总结一下:

1、刚体变换:平移+旋转,只改变物体位置,不改变物体形状
2、仿射变换:改变物体位置和形状,但是保持“平直性”
3、投影变换:彻底改变物体位置和形状

在这里插入图片描述

7、变换矩阵的物理意义

在这里插入图片描述

二 、单应性变换

在这里插入图片描述在这里插入图片描述
在这里插入图片描述在这里插入图片描述在这里插入图片描述

三、平面坐标系与齐次坐标系

齐次坐标到底是什么?
在这里插入图片描述

一、透视变换理解

一、定义

透视变换(Perspective Transformation)的本质是将图像投影到一个新的视平面(Viewing Plane),也称作投影映射(Projective Mapping)。
在这里插入图片描述
在这里插入图片描述

二、透视变换的变换矩阵计算

透视变换(Perspective Transformation)的本质是将图像投影到一个新的视平面,其通用变换公式为:
在这里插入图片描述

x,y,z 为原始图像像素点的齐次坐标,(X’=X/Z,Y’=Y/Z,Z’ =Z/Z ) 为变换之后的图像像素点的齐次坐标。

即原始图像像素点的齐次坐标(x,y,z)对应得到变换后的图像像素点的齐次坐标(X’;Y’;Z’)其中Z’=1,则点(X’;Y’)就是原图像对应的像素点的二维平面坐标经过变换后的二维平面坐标:
在这里插入图片描述

透视变换矩阵图解如下:
在这里插入图片描述 其中
在这里插入图片描述

原始图像像素点的齐次坐标(x,y,z)对应变换之后的图像像素点的齐次坐标(X;Y;Z)。将Z归一化后,得到归一化后的齐次坐标(X’;Y’;1),则其变换之后的图像像素点的齐次坐标(X;Y;Z)对应的二维平面坐标为(X’;Y’)
即当齐次坐标Z’=1,则点(X’;Y’)就是原图像对应的像素点的二维平面坐标经过变换后的二维平面坐标:
在这里插入图片描述
一般地,我们令a33=1,展开上面公式,得到一个点的放射变换:

在这里插入图片描述
在这个方程中,总共有8个未知数,因此我们可以找到4对8个点(每个两个对应,原平面上的点和其对应映射到新的视平面的点为一对)
列出方程。解出,参数a11 、a12、a13、a21、a22、a23、a31、a32。
假设这8个点为:
源点四个坐标分别为A:(x0,y0),(x1,y1),(x2,y2),(x3,y3)
目标点四个坐标分别为B:(X’0,Y’0),(X’1,Y’1),(X’2,Y’2),(X’3,Y’3)
则带入方程(写成矩阵形式)得:
在这里插入图片描述

三、求解出变换矩阵后如何使用

一、使用方法

首先,我们假设变换好的图像为new_image 大小跟原图image一样大,然后我们遍历图像new_image行和列,即遍历new_image的每一个像素坐标(Y,X,1),然后利用变换矩阵warpMatrix计算该坐标在原图中的对应位置(y,x,1),将原图中该位置的像素值p(y,x,1)赋值到变换后的图new_image中的(Y,X,1)位置。超出原图像素坐标的点可以随意赋值,看个人喜欢。一般赋值为边缘像素值

二、求(y,x,1)坐标方法

1、手推公式法

在这里插入图片描述

2、矩阵运算法

在这里插入图片描述原图:
在这里插入图片描述
原图像的四个点
src = np.float32([[207, 151], [517, 285], [17, 601], [343, 731]])
对应变换后的四个点
dst = np.float32([[0, 0], [337, 0], [0, 488], [337, 488]])
变换矩阵
[[ 8.92263779e-01 3.76733596e-01 -2.41585375e+02]
[-4.08140258e-01 9.44205073e-01 -5.80899328e+01]
[-8.53836442e-05 5.16464182e-05 1.00000000e+00]]
变换后的图
在这里插入图片描述

求解出的变换矩阵就可以将一个正方形变换到四边形。反之,四边形变换到正方形也是一样的。于是,我们通过两次变换:四边形变换到正方形+正方形变换到四边形就可以将任意一个四边形变换到另一个四边形。

在这里插入图片描述
因此,给定透视变换对应的四对像素点坐标,即可求得透视变换矩阵;反之,给定透视变换矩阵,即可对图像或像素点坐标完成透视变换,如下图所示:
在这里插入图片描述
https://blog.csdn.net/xiaowei_cqu/article/details/26471527
https://blog.csdn.net/u010925447/article/details/77947398?utm_source=blogxgwz6
https://zhuanlan.zhihu.com/p/74597564

  • 126
    点赞
  • 446
    收藏
    觉得还不错? 一键收藏
  • 15
    评论
### 回答1: 《视觉SLAM十四讲》第三章主要介绍了视觉SLAM中的关键技术——特征提取和描述子。本章首先介绍了特征点的概念和特征点的选择原则。特征点即图像中具有鲁棒性和区分度的点,可以通过对其进行检测和描述来进行特征匹配和跟踪。在进行特征提取时,作者介绍了常见的特征检测算法,如Harris角点检测、SIFT和SURF算法等,并对其进行了比较和分析。 接着,本章详细阐述了特征描述子的概念和作用。特征描述子是对特征点周围区域的图像信息进行编码,以实现特征匹配和跟踪。常见的特征描述子包括SIFT、SURF和ORB等。作者从描述子的表示形式、计算方式和匹配方法等方面进行了介绍,并对它们进行了比较和评价。同时,还提到了基于二进制描述子的方法,如BRIEF、BRISK和FREAK等。 在特征匹配方面,本章介绍了特征描述子匹配的基本原理和流程。以基于特征点的视觉SLAM为例,作者详细解释了特征点的匹配过程,包括特征点的选择、特征点描述子匹配和筛选等步骤。并介绍了如何通过验证特征点的三角化和PnP求解来估计相机的位姿。 此外,本章还介绍了一些特定场景下的特征点选择和提取策略,如动态环境下的特征点追踪和关键帧选择等。 综上所述,《视觉SLAM十四讲》第三章主要介绍了特征提取和描述子在视觉SLAM中的重要性和应用。通过对特征点的检测和描述,可以实现特征匹配和跟踪,为后续的相机位姿估计和建图提供基础。该章内容详细且通俗易懂,对于学习和理解视觉SLAM有着重要的指导作用。 ### 回答2: 《视觉SLAM十四讲-Ch3》主要介绍了视觉SLAM(同时定位与建图)技术的基本原理和实现方法。本章主要涵盖了三维几何表示和变换、相机模型和相机姿态以及特征提取与匹配等内容。 首先,本章介绍了三维几何表示和变换的概念。通过介绍欧氏空间中的点、向量和坐标变换,深入解释了相机在三维空间中的位置和朝向的表示方式。同时,引入了齐次坐标和投影矩阵的概念,为后续的相机模型和姿态估计打下了基础。 其次,本章详细讲解了相机模型和相机姿态的原理与应用。其中,介绍了针孔相机模型,分析了图像坐标和相机坐标之间的映射关系。通过投影矩阵的推导,给出了透视投影和仿射投影的公式,并解释了相机焦距和主点的含义。此外,还介绍了如何通过计算相机的外参矩阵来估计相机的姿态,以及如何将图像坐标转换为相机坐标。 最后,本章介绍了特征提取与匹配的技术。首先,介绍了角点和边缘点的概念,以及如何利用差分和梯度计算来检测图像中的角点和边缘点。然后,介绍了如何通过特征描述符来表示图像中的特征点,并通过特征匹配算法找到两幅图像之间的对应关系。特征提取与匹配是视觉SLAM中非常重要的步骤,对于后续的相机定位和建图至关重要。 综上所述,《视觉SLAM十四讲-Ch3》通过系统地介绍了视觉SLAM技术的基本概念和实现方法,包括三维几何表示和变换、相机模型和相机姿态的原理与应用,以及特征提取与匹配的技术。这些内容为读者深入理解和掌握SLAM技术提供了很好的基础。 ### 回答3: 视觉SLAM(Simultaneous Localization and Mapping)是一种通过计算机视觉技术,实现机器智能的同时实时定位和地图构建的方法。在《视觉SLAM十四讲》第三讲中,主要介绍了视觉SLAM的基本概念和关键技术。 首先,讲解了视觉SLAM的理论基础,包括自我运动估计和地图构建两个部分。自我运动估计是通过相邻帧之间的视觉信息,计算相机在三维空间中的运动,从而实现机器的实时定位;地图构建是通过对场景中特征点的观测和跟踪,建立起一个三维空间中的地图。这两个过程相互影响,通过不断迭代优化,实现高精度的定位和地图构建。 接着,讲解了基于特征的视觉SLAM算法。特征提取与描述是建立视觉SLAM系统的关键步骤,通过提取场景中的特征点,并为其生成描述子,来实现特征点的匹配和跟踪。同时,还介绍了一些常用的特征点提取和匹配算法,如FAST、SIFT等。 在SLAM框架方面,本节还介绍了基于视觉的前端和后端优化。前端主要负责实时的特征跟踪和估计相机运动,后端则是通过优化技术,对前端输出的轨迹和地图进行优化求解,从而提高系统的精度和鲁棒性。 最后,本节提到了几个视觉SLAM的应用场景,如自主导航、增强现实等。这些应用对于实时高精度的定位和地图建立都有着很高的要求,因此,视觉SLAM的技术在这些领域有着广泛的应用前景。 总的来说,《视觉SLAM十四讲》第三讲对视觉SLAM的基本概念和关键技术进行了系统的介绍。理论基础、特征提取与描述、SLAM框架和应用场景等方面的内容都给出了详细的解释和案例,有助于读者更好地理解和应用视觉SLAM技术。
评论 15
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值