《视觉SLAM十四讲》学习笔记-3D->2D: PnP问题的由来

PnP问题

  • PnP为 Perspective-n-Point的简称,是求解3D到2D点对的运动的方法:即给出n个3D空间点时,如何求解相机的位姿
  • 典型的PnP问题求解方式有很多种,例如P3P, 直接线性变换(DLT), EPnP(Efficient PnP), UPnP。还有非线性的Bundle Adjustment.

DLT, 直接线性变换

高空间点 P P 的齐次方程为P=(X,Y,Z),投影到特征点 x⃗ 1=(u1,v1,1) x → 1 = ( u 1 , v 1 , 1 ) ,为求解 R R t⃗  t → ,定义增广矩阵 [R|t⃗ ] [ R | t → ] :
展开等式后可得到:

su1v11=t1t5t9t2t6t10t3t7t11t4t8t12XYZ1 s [ u 1 v 1 1 ] = [ t 1 t 2 t 3 t 4 t 5 t 6 t 7 t 8 t 9 t 10 t 11 t 12 ] [ X Y Z 1 ]

消去 s s 后可得到约束:
u1=t1X+t2Y+t3Z+t4t9X+t10Y+t11Z+t12  v1=t5X+t6Y+t7Z+t8t9X+t10Y+t11Z+t12

假设:
t⃗ 1=(t1,t2,t3,t4),  t⃗ 2=(t5,t6,t7,t8),  t⃗ 3=(t9,t10,t11,t12) t → 1 = ( t 1 , t 2 , t 3 , t 4 ) ⊤ ,     t → 2 = ( t 5 , t 6 , t 7 , t 8 ) ⊤ ,     t → 3 = ( t 9 , t 10 , t 11 , t 12 ) ⊤

则有:
t⃗ 1Pt⃗ 3Pu1=0,t⃗ 2Pt⃗ 3Pv1=0 t → 1 ⊤ P − t → 3 ⊤ P u 1 = 0 , t → 2 ⊤ P − t → 3 ⊤ P v 1 = 0

上式中 t⃗  t → 是待求的变量。易知一个特征点可提供两个关于 t⃗  t → 的约束,假若存在 N N 个特征点,则有如下方程成立:
[P10u1P10P1v1P1PN0uNPN0PNvNPN][t1t2t3]=0

观察到 t⃗  t → 有12个变量,通过方程形式可知最少可以通过6对匹配点即可得到 T T 的解。所以本方法又可称为直接线性变换法;当匹配点大于六对时,可以使用SVD等方法对超定方程求最小二乘解。

注意到DLT解出的T是由R和t两部分构成的,因而 R R 满足 R=SO(3) R = S O ( 3 ) ,所以对于T矩阵需要寻找一个最好的旋转矩阵,这可以由QR分解完成,相当于把结果从矩阵空间重影到 SE(3) S E ( 3 ) 流形上,转成旋转和平移两部分。

P3P问题

P3P问题

首先设标记符号定义如上图所示。其中A,B,C为世界坐标系。图中为3D到3D的对应点,所以是把PnP问题转化为ICP问题。

先利用三解形近似关系有以下三解形相似:

OabOAB,  ObcOBC,  OacOAC △ O a b − △ O A B ,     △ O b c − △ O B C ,     △ O a c − △ O A C

考虑余弦关系:

OA2+OB22OAOBcos<a,b>=AB2OB2+OC22OBOCcos<b,c>=BC2OA2+OBC22OAOCcos<a,c>=AC2 O A 2 + O B 2 − 2 ⋅ O A ⋅ O B ⋅ cos < a , b >= A B 2 O B 2 + O C 2 − 2 ⋅ O B ⋅ O C ⋅ cos < b , c >= B C 2 O A 2 + O B C 2 − 2 ⋅ O A ⋅ O C ⋅ cos < a , c >= A C 2

左右两边同时除以 OC2 O C 2 , 令 x=OA/OC x = O A / O C , y=OB/OC y = O B / O C 有:
x2+y22xycos<a,b>=AB2/OC2y2+122ycos<b,c>=BC2/OC2x2+122xcos<a,c>=AC2/OC2 x 2 + y 2 − 2 x y cos < a , b >= A B 2 / O C 2 y 2 + 1 2 − 2 y c o s < b , c >= B C 2 / O C 2 x 2 + 1 2 − 2 x cos < a , c >= A C 2 / O C 2

再令 v=AB2/OC2 v = A B 2 / O C 2 , v=BC2/OC2OC2/AB2 v = B C 2 / O C 2 O C 2 / A B 2 , w=AC2/OC2OC2/AB2 w = A C 2 / O C 2 O C 2 / A B 2 ,有
x2+y22xycos<a,b>v=0y2+122ycos<b,c>uv=0x2+122xcos<a,c>wv=0 x 2 + y 2 − 2 x y cos < a , b > − v = 0 y 2 + 1 2 − 2 y cos < b , c > − u v = 0 x 2 + 1 2 − 2 x cos < a , c > − w v = 0

从上式中先解出 v v ,代入第二和第三个式子,有

(1u)y2ux2cos<b,c>y+2uxycos<a,b>+1=0(1w)x2wy2cos<a,c>x+2wxycos<a,b>+1=0x2+122xcos<a,c>wv=0

上式中由于 A,B,C A , B , C 已知, x,y x , y 未知。是一个二元二次方程,最多可得到4个解。需要一个验证点来获得最优解。

可以看到, 利用三角形的相似性质,PnP问题转为了一个3D到3D的位姿估计问题

P3P的问题:
1. 只利用三个点的信息,当给定的配对点多于3组时,难以利用更多的信息;
2. 如果数据点存在噪声时,或者匹配是误匹配的情况下,算法失败。

PnP在SLAM问题中的角色:进行相机位姿估计,然后构建最小二乘优化问题对估计值进行调整(Bundle Adjustment, BA)

### 回答1: 《视觉SLAM十四》第三章主要介绍了视觉SLAM中的关键技术——特征提取和描述子。本章首先介绍了特征点的概念和特征点的选择原则。特征点即图像中具有鲁棒性和区分度的点,可以通过对其进行检测和描述来进行特征匹配和跟踪。在进行特征提取时,作者介绍了常见的特征检测算法,如Harris角点检测、SIFT和SURF算法等,并对其进行了比较和分析。 接着,本章详细阐述了特征描述子的概念和作用。特征描述子是对特征点周围区域的图像信息进行编码,以实现特征匹配和跟踪。常见的特征描述子包括SIFT、SURF和ORB等。作者从描述子的表示形式、计算方式和匹配方法等方面进行了介绍,并对它们进行了比较和评价。同时,还提到了基于二进制描述子的方法,如BRIEF、BRISK和FREAK等。 在特征匹配方面,本章介绍了特征描述子匹配的基本原理和流程。以基于特征点的视觉SLAM为例,作者详细解释了特征点的匹配过程,包括特征点的选择、特征点描述子匹配和筛选等步骤。并介绍了如何通过验证特征点的三角化和PnP求解来估计相机的位姿。 此外,本章还介绍了一些特定场景下的特征点选择和提取策略,如动态环境下的特征点追踪和关键帧选择等。 综上所述,《视觉SLAM十四》第三章主要介绍了特征提取和描述子在视觉SLAM中的重要性和应用。通过对特征点的检测和描述,可以实现特征匹配和跟踪,为后续的相机位姿估计和建图提供基础。该章内容详细且通俗易懂,对于学习和理解视觉SLAM有着重要的指导作用。 ### 回答2: 《视觉SLAM十四-Ch3》主要介绍了视觉SLAM(同时定位与建图)技术的基本原理和实现方法。本章主要涵盖了三维几何表示和变换、相机模型和相机姿态以及特征提取与匹配等内容。 首先,本章介绍了三维几何表示和变换的概念。通过介绍欧氏空间中的点、向量和坐标变换,深入解释了相机在三维空间中的位置和朝向的表示方式。同时,引入了齐次坐标和投影矩阵的概念,为后续的相机模型和姿态估计打下了基础。 其次,本章详细解了相机模型和相机姿态的原理与应用。其中,介绍了针孔相机模型,分析了图像坐标和相机坐标之间的映射关系。通过投影矩阵的推导,给出了透视投影和仿射投影的公式,并解释了相机焦距和主点的含义。此外,还介绍了如何通过计算相机的外参矩阵来估计相机的姿态,以及如何将图像坐标转换为相机坐标。 最后,本章介绍了特征提取与匹配的技术。首先,介绍了角点和边缘点的概念,以及如何利用差分和梯度计算来检测图像中的角点和边缘点。然后,介绍了如何通过特征描述符来表示图像中的特征点,并通过特征匹配算法找到两幅图像之间的对应关系。特征提取与匹配是视觉SLAM中非常重要的步骤,对于后续的相机定位和建图至关重要。 综上所述,《视觉SLAM十四-Ch3》通过系统地介绍了视觉SLAM技术的基本概念和实现方法,包括三维几何表示和变换、相机模型和相机姿态的原理与应用,以及特征提取与匹配的技术。这些内容为读者深入理解和掌握SLAM技术提供了很好的基础。 ### 回答3: 视觉SLAM(Simultaneous Localization and Mapping)是一种通过计算机视觉技术,实现机器智能的同时实时定位和地图构建的方法。在《视觉SLAM十四》第三中,主要介绍了视觉SLAM的基本概念和关键技术。 首先,解了视觉SLAM的理论基础,包括自我运动估计和地图构建两个部分。自我运动估计是通过相邻帧之间的视觉信息,计算相机在三维空间中的运动,从而实现机器的实时定位;地图构建是通过对场景中特征点的观测和跟踪,建立起一个三维空间中的地图。这两个过程相互影响,通过不断迭代优化,实现高精度的定位和地图构建。 接着,解了基于特征的视觉SLAM算法。特征提取与描述是建立视觉SLAM系统的关键步骤,通过提取场景中的特征点,并为其生成描述子,来实现特征点的匹配和跟踪。同时,还介绍了一些常用的特征点提取和匹配算法,如FAST、SIFT等。 在SLAM框架方面,本节还介绍了基于视觉的前端和后端优化。前端主要负责实时的特征跟踪和估计相机运动,后端则是通过优化技术,对前端输出的轨迹和地图进行优化求解,从而提高系统的精度和鲁棒性。 最后,本节提到了几个视觉SLAM的应用场景,如自主导航、增强现实等。这些应用对于实时高精度的定位和地图建立都有着很高的要求,因此,视觉SLAM的技术在这些领域有着广泛的应用前景。 总的来说,《视觉SLAM十四》第三视觉SLAM的基本概念和关键技术进行了系统的介绍。理论基础、特征提取与描述、SLAM框架和应用场景等方面的内容都给出了详细的解释和案例,有助于读者更好地理解和应用视觉SLAM技术。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值