【立体视觉(一)】由基本矩阵、本质矩阵恢复摄像机矩阵——Structure from motion

最近在研究立体视觉,已经有一些日子了。相关理论对数学要求有点高,看了很久才有了一些系统的了解,并做了一些实验帮助理解。

本文会介绍Structure from motion中,利用两视图恢复相机位姿的内容,这也是三维重建的基础。

本文主要基于《Multiple View Geometry in Computer Vision(计算机视觉中的多视图几何)》这本书来梳理算法流程,有部分推导过程没有给出,读者可自行查阅


刚开始写微博,经验很少,不足之处,还请各位指导,如有错误,恳请指正。希望能向大家多多学习,共同研究和进步。

----------------------------------------------------------------------------------------------------------------------------------------------------------

条件:已获取相机在两不同位置拍摄的图像,没有空间标定物,可以不进行摄像机的标定;

目标:求出相机在3D空间中的摄像机矩阵,以便用于三维重构;

缺陷:在上述条件下,获得的摄像机矩阵与实际相差一个射影变换。


0、基础知识和参数

    射影变换和单应性矩阵:

射影变换过程中不变的性质有共点、共线、相交等,单应性矩阵H可以用来表示射影变换,并且通过H矩阵联系起来的对应点是唯一的。

    摄像机矩阵P:

摄像机矩阵由内参数矩阵K和外参数矩阵[R|t]组成,简单来说,P=K[R|t]。对于空间中的一个3D点X,其在图像上的投影为x=PX。

    齐次坐标:

本文中用的都是齐次坐标,不懂的童鞋可以自行查阅齐次坐标的定义和性质。


1.对极几何



    摄像机中心在C和C‘时分别采集两幅图像,如图(a),空间中的一点X在平面上的投影x和x',即为空间点X与摄像机中心c和c'连线和成像平面的交点。

    图(b)中展示了成像过程中的数学关系。其中,摄像机中心的连线与成像平面的交点e和e'为对极点(也是摄像机中心在另一平面上的投影)。若已知左图的摄像机中心C、成像点x,则可以确定C,x,X三点所在的直线,该直线在右侧成像面的投影I’即为x对应的对极线。显然,X在右侧平面的投影x'在此对极线I‘上。

   

2.基本矩阵

    (1)几何推导

    由上图的投影关系我们可以知道,对于空间中任意一点X,在两平面中分别有唯一的点x和x'与其对应,换句话说,这两个平面点是射影等价的。因此可以找到一个单应矩阵H,使得

    x'=Hx(根据射影变换的性质)

    而在右图中,由对极点e'和成像点x',可以表示出对极线

    I’=e'×x'(根据其次坐标的性质)

    这样,I‘=e'×Hx

    我们可以令基本矩阵

   F=e'×H,即I‘=Fx

    上式给出了基本矩阵F的定义,但是这又有什么用呢?直观上我们能感觉到,F可以表征左右两幅图的位置关

  • 11
    点赞
  • 47
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
### 回答1: SFM(结构光三维重建)算法是一种利用结构光原理进行双目立体视觉三维重建的算法。它通过对两个摄像机的图像进行分析和匹配,得出物体的三维形状和位置信息。 在使用Python实现SFM算法时,可以利用一些开源库或工具来辅助完成。首先,可以使用OpenCV库来进行图像处理和特征提取。接下来,可以使用一些Python库,如NumPy、SciPy等,进行线性代数运算和数值计算。此外,还可以使用Matplotlib等库来进行可视化展示。 具体而言,SFM算法的实现可以包括以下步骤: 1. 数据获取:获取双目摄像机的图像数据。 2. 相机标定:通过拍摄特定的标定板图案,对相机的内参和外参进行标定。 3. 特征提取与匹配:利用OpenCV库提取图像中的特征点,并进行匹配,建立两个相机之间的对应关系。 4. 三角测量:根据匹配的特征点的像素坐标和相机的内参矩阵,通过三角测量方法计算出三维空间中的点云坐标。 5. 点云处理与优化:对得到的点云进行处理和优化,去除噪声和重复点,并进行稠密重建。 6. 可视化展示:使用Matplotlib库,将三维点云以图形的方式展示出来。 通过以上步骤的实现,可以利用SFM算法进行双目立体视觉三维重建,得到物体的三维形状和位置信息。在Python中,可以借助开源库和工具的支持,较为方便地实现SFM算法的应用。 ### 回答2: SFMStructure from Motion)是一种常用的双目立体视觉三维重建算法,可以通过一系列图像中的特征点来重建场景的三维结构。 使用Python进行SFM算法实现的关键是使用合适的库和工具。在Python中,有一些流行的计算机视觉库,如OpenCV和Scikit-learn,可以提供处理视觉数据的功能。 SFM算法的实现主要包括以下步骤: 1. 特征提取:首先需要从双目图像中提取特征点。可以使用OpenCV中的SIFT、SURF、ORB等算法来检测和描述图像中的特征点。 2. 特征匹配:通过比较两个图像中的特征描述子,可以找到对应的特征点。可以使用OpenCV中的BFMatcher或FlannBasedMatcher等算法来进行特征匹配。 3. 三角化:通过已匹配的特征点对,可以计算相机的投影矩阵,然后使用三角化方法,如DLT(Direct Linear Transform)或SVD(Singular Value Decomposition),来获取三维点云。 4. 姿态估计:根据相机的运动和三维点云的位置,可以通过PnP(Perspective-n-Point)问题,使用RANSAC或其他方法估计相机的姿态。 5. 3D重建:根据相机的姿态和三维点云,可以将所有的点云位置合并起来,生成场景的三维重建结果。 在Python中,可以借助OpenCV、NumPy和SciPy等库来实现SFM算法的各个步骤。可以使用OpenCV的函数来进行特征提取和匹配,可以使用NumPy和SciPy的矩阵操作和优化函数来进行三角化和姿态估计。 综上所述,使用Python实现SFM算法的双目立体视觉三维重建,需要综合运用不同的库和工具,根据SFM算法的步骤,逐步实现特征提取、特征匹配、三角化、姿态估计和3D重建等功能。 ### 回答3: SFMStructure From Motion)算法是一种在双目立体视觉中用于三维重建的方法。它通过对一组从不同视角拍摄的图像中的特征点进行匹配和跟踪,来推断场景中的3D结构和摄像机姿态。 在Python中,可以使用OpenCV库中的SFM模块来实现SFM算法。首先,需要导入必要的库和模块。然后,加载图像序列,并对图像进行预处理,例如去除畸变、调整大小等。接下来,可以使用OpenCV提供的特征检测和匹配算法来提取和匹配特征点。然后,可以利用这些匹配点的二维坐标信息以及相机内参数,通过三角化方法计算出对应的三维点坐标。 在计算出三维点坐标后,可以使用Bundle Adjustment(束调整)算法对重建结果进行优化,以提高精度。最后,将重建后的点云可视化或保存为其他数据格式,以获取具体的三维重建结果。 在实际使用中,还需要考虑到图像间的匹配误差、遮挡问题以及特征点跟踪的稳定性等因素,以提高重建效果和鲁棒性。因此,需要合理选择和调整SFM算法的参数,并结合其他相关的图像处理和计算机视觉技术来实现双目立体视觉三维重建。 总之,利用SFM算法进行双目立体视觉三维重建是一种常见且有效的方法。在Python中,可以通过使用OpenCV库中的SFM模块来实现该算法,并结合其他图像处理和计算机视觉技术来优化重建结果。
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值