[学习笔记-SLAM篇]视觉SLAM十四讲ch5

本讲主要是相机模型相关的内容,理解比较容易。

注:
1)学习视频:【高翔】视觉SLAM十四讲

第5讲

5.1 理论部分

前面主要围绕位姿进行讨论(求解及优化相关),这一讲主要针对观测问题,与相机模型有关。

1)相机模型

  • 单目相机模型主要使用针孔模型
    在这里插入图片描述

注:
图片来源:针孔相机模型和相机镜头畸变模型

  • 依据相似三角形并去掉负号,结合单位变换(像素与米之间的转换)、图像原点在像素系的平移,可以得到相机系与像素系之间的关系——内参矩阵 K \pmb{K} KKK,对应公式 Z ( u v 1 ) = ( f x 0 c x 0 f y c y 0 0 1 ) ( X Y Z ) = d e f K P Z\begin{pmatrix} u \\ v \\ 1\end{pmatrix}=\begin{pmatrix} f_x & 0 & c_x \\ 0 & f_y & c_y \\ 0 & 0 & 1\end{pmatrix}\begin{pmatrix} X \\ Y \\ Z\end{pmatrix}\overset{def}{=}\pmb{KP} Zuv1=fx000fy0cxcy1XYZ=defKPKPKP,其实际意义是改变 Z Z Z时,投影点仍是同一个

在这里插入图片描述

注:
图片来源:【高翔】视觉SLAM十四讲

  • 内参矩阵 K K K出厂后固定不变(但若对图像剪切或压缩等操作改变分辨率后 K K K会改变,则需要重新标定);
  • 世界系与相机系之间的关系——外参矩阵 T \pmb{T} TTT(实际是相机的位姿 R , t R,t R,t,可以直接用变换矩阵 T T T代替),外参矩阵是会改变的;
  • 世界系到像素系的变换对应公式 Z P u v = Z [ u v 1 ] = K ( R P W + t ) = K T P W Z\pmb{P}_{uv}=Z\begin{bmatrix} u \\ v \\ 1\end{bmatrix}=\pmb{K}(\pmb{RP}_W+\pmb{t})=\pmb{KT}\pmb{P}_W ZPPPuv=Zuv1=KKK(RPRPRPW+ttt)=KTKTKTPPPW,公式中也隐含了多次齐次与非齐次的变换(首先世界系下的3×1 P W \pmb{P}_W PPPW齐次为4×1维,然后左乘4×4维的变换矩阵 T \pmb{T} TTT,得到4×1维结果,再非齐次为3×1维,左乘3×3维内参矩阵 R \pmb{R} RRR,得到3×1维结果;若将公式左边的 Z Z Z移到右边,则相当于将右边3×1维结果归一化(非齐次)为2×1维结果,与左边剩下的2×1维像素坐标 P u v \pmb{P}_{uv} PPPuv对应);
  • 畸变模型包含径向畸变切向畸变2部分。径向畸变含有桶形畸变(图像变小)和枕型畸变(图像变大),与像素和图像中心的距离有关;切向畸变与安装误差有关;
  • 通常对归一化平面上的点计算畸变;
  • 单目相机成像过程世界系 P W \pmb{P}_W PPPW ⟶ T \stackrel{T}{\longrightarrow} T 相机系 ⟶ / Z \stackrel{/Z}{\longrightarrow} /Z 归一化平面 P c \pmb{P}_c PPPc ⟶ 畸变 \stackrel{\text{畸变}}{\longrightarrow} 畸变 像素系 P u v \pmb{P}_{uv} PPPuv
  • 双目相机模型可看作是2个针孔模型,原理主要基于下图;
    在这里插入图片描述

注:
图片来源:相机模型和双目立体匹配

  • 依据右边的两个相似三角形关系,有 z − f z = b − u L + u R b \frac{z-f}{z}=\frac{b-u_L+u_R}{b} zzf=bbuL+uR,整理得 z = f b d z=\frac{fb}{d} z=dfb d = u L − u R d=u_L-u_R d=uLuR视差(视差最小为1个像素,双目深度存在理论上的最大值);
  • 双目成像时,基线 b b b越长,可计算的距离越远;视差 d d d越小,物体距离相机越近
  • RGB-D相机一般有2种测量深度的方式:红外结构光(依据返回的结构光图案)和ToF(依据光束飞行时间)。RGB-D相机可以生成彩色图,以及与彩色图像素信息对应的深度图。

2)图像

  • 图像用矩阵(二维数组)表示,一般图像系的原点在图像左上角,每个像素位置 ( x , y ) (x,y) (x,y)对应一个灰度值 I I I x x x表示行, y y y表示列;
  • 灰度图的灰度用0~255表示,对应全黑 ⟶ {\longrightarrow} 全白;
  • 深度图的信息用0~65535表示,每1000表示1m,最大可表示65m;
  • 彩色图有三个通道,每个通道(R、G、B)用0~255表示,有时也用A表示透明度,则为R、G、B、A四个通道。

5.2 实践部分

待续ing

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 《视觉SLAM十四》第三章主要介绍了视觉SLAM中的关键技术——特征提取和描述子。本章首先介绍了特征点的概念和特征点的选择原则。特征点即图像中具有鲁棒性和区分度的点,可以通过对其进行检测和描述来进行特征匹配和跟踪。在进行特征提取时,作者介绍了常见的特征检测算法,如Harris角点检测、SIFT和SURF算法等,并对其进行了比较和分析。 接着,本章详细阐述了特征描述子的概念和作用。特征描述子是对特征点周围区域的图像信息进行编码,以实现特征匹配和跟踪。常见的特征描述子包括SIFT、SURF和ORB等。作者从描述子的表示形式、计算方式和匹配方法等方面进行了介绍,并对它们进行了比较和评价。同时,还提到了基于二进制描述子的方法,如BRIEF、BRISK和FREAK等。 在特征匹配方面,本章介绍了特征描述子匹配的基本原理和流程。以基于特征点的视觉SLAM为例,作者详细解释了特征点的匹配过程,包括特征点的选择、特征点描述子匹配和筛选等步骤。并介绍了如何通过验证特征点的三角化和PnP求解来估计相机的位姿。 此外,本章还介绍了一些特定场景下的特征点选择和提取策略,如动态环境下的特征点追踪和关键帧选择等。 综上所述,《视觉SLAM十四》第三章主要介绍了特征提取和描述子在视觉SLAM中的重要性和应用。通过对特征点的检测和描述,可以实现特征匹配和跟踪,为后续的相机位姿估计和建图提供基础。该章内容详细且通俗易懂,对于学习和理解视觉SLAM有着重要的指导作用。 ### 回答2: 《视觉SLAM十四-Ch3》主要介绍了视觉SLAM(同时定位与建图)技术的基本原理和实现方法。本章主要涵盖了三维几何表示和变换、相机模型和相机姿态以及特征提取与匹配等内容。 首先,本章介绍了三维几何表示和变换的概念。通过介绍欧氏空间中的点、向量和坐标变换,深入解释了相机在三维空间中的位置和朝向的表示方式。同时,引入了齐次坐标和投影矩阵的概念,为后续的相机模型和姿态估计打下了基础。 其次,本章详细解了相机模型和相机姿态的原理与应用。其中,介绍了针孔相机模型,分析了图像坐标和相机坐标之间的映射关系。通过投影矩阵的推导,给出了透视投影和仿射投影的公式,并解释了相机焦距和主点的含义。此外,还介绍了如何通过计算相机的外参矩阵来估计相机的姿态,以及如何将图像坐标转换为相机坐标。 最后,本章介绍了特征提取与匹配的技术。首先,介绍了角点和边缘点的概念,以及如何利用差分和梯度计算来检测图像中的角点和边缘点。然后,介绍了如何通过特征描述符来表示图像中的特征点,并通过特征匹配算法找到两幅图像之间的对应关系。特征提取与匹配是视觉SLAM中非常重要的步骤,对于后续的相机定位和建图至关重要。 综上所述,《视觉SLAM十四-Ch3》通过系统地介绍了视觉SLAM技术的基本概念和实现方法,包括三维几何表示和变换、相机模型和相机姿态的原理与应用,以及特征提取与匹配的技术。这些内容为读者深入理解和掌握SLAM技术提供了很好的基础。 ### 回答3: 视觉SLAM(Simultaneous Localization and Mapping)是一种通过计算机视觉技术,实现机器智能的同时实时定位和地图构建的方法。在《视觉SLAM十四》第三中,主要介绍了视觉SLAM的基本概念和关键技术。 首先,解了视觉SLAM的理论基础,包括自我运动估计和地图构建两个部分。自我运动估计是通过相邻帧之间的视觉信息,计算相机在三维空间中的运动,从而实现机器的实时定位;地图构建是通过对场景中特征点的观测和跟踪,建立起一个三维空间中的地图。这两个过程相互影响,通过不断迭代优化,实现高精度的定位和地图构建。 接着,解了基于特征的视觉SLAM算法。特征提取与描述是建立视觉SLAM系统的关键步骤,通过提取场景中的特征点,并为其生成描述子,来实现特征点的匹配和跟踪。同时,还介绍了一些常用的特征点提取和匹配算法,如FAST、SIFT等。 在SLAM框架方面,本节还介绍了基于视觉的前端和后端优化。前端主要负责实时的特征跟踪和估计相机运动,后端则是通过优化技术,对前端输出的轨迹和地图进行优化求解,从而提高系统的精度和鲁棒性。 最后,本节提到了几个视觉SLAM的应用场景,如自主导航、增强现实等。这些应用对于实时高精度的定位和地图建立都有着很高的要求,因此,视觉SLAM的技术在这些领域有着广泛的应用前景。 总的来说,《视觉SLAM十四》第三视觉SLAM的基本概念和关键技术进行了系统的介绍。理论基础、特征提取与描述、SLAM框架和应用场景等方面的内容都给出了详细的解释和案例,有助于读者更好地理解和应用视觉SLAM技术。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值