【计算机视觉】Lecture 25：运动中恢复结构（SfM）

最新推荐文章于 2024-07-23 10:41:22 发布

无用闲士

最新推荐文章于 2024-07-23 10:41:22 发布

阅读量2.1k

点赞数 1

分类专栏：计算机视觉文章标签：计算机视觉

原文链接：http://www.cse.psu.edu/~rtc12/CSE486/

版权

计算机视觉专栏收录该内容

37 篇文章 38 订阅

订阅专栏

SfM

给定一组随时间变化的运动相机的流场或位移矢量，确定：

• 相机位姿的序列

• 场景的三维结构

在这里插入图片描述

SFM “Killer App”

Match Move

通过一个视频帧序列跟踪一组特征点

推断相机的位置和被跟踪特征点的三维位置

根据场景/相机推导出的三维几何来渲染合成对象

因子分解Factorization

Tomasi and Kanade, “Shape and Motion from Image Streams under Orthography,” International Journal of Computer Vision (IJCV), Vol 9, pp.137-154, 1992.

目标：在多帧上从多个点中结合对应点信息，以解决场景结构和相机运动（运动中恢复结构）

方法：基于SVD对观测点位置矩阵进行“因子分解”的数值稳定方法。

历史意义：在那之前，大多数SfM工作只处理最小配置和无噪声数据。因子分解是最早的“实用SFM算法”之一

回忆：世界坐标到像极坐标的变换

在这里插入图片描述

透视投影

在这里插入图片描述

• 非线性方程

• 射线 OP 上的任何点都有成像点 p ！！

在这里插入图片描述
透视投影：平行线似乎在灭点相交；更远的物体看起来更小

简化：弱透视

在这里插入图片描述
弱透视 = 平行投影（平行线保持平行）+ 缩放以模拟由于物体距离引起的尺寸变化。

更简单的：正投影

在这里插入图片描述

纯平行投影。高度简化的情况下，我们甚至忽略了由于距离进行的缩放。

透视矩阵方程（相机坐标系下）

透视矩阵方程（相机坐标系中）

弱透视近似

在这里插入图片描述

正投影

在这里插入图片描述

和外参结合

在这里插入图片描述

正投影：代数方程

在这里插入图片描述

多点，多帧

在这里插入图片描述

因子分解方法

在这里插入图片描述

N个点P1，P2，…，Pj，…，PN（我们希望恢复它们）
注意，点集的绝对位置是无法唯一恢复的，所以…

第一招：将世界坐标系的原点设为 N 个点的中心！

在这里插入图片描述

质心在 0 处：

在这里插入图片描述

意味着：

在这里插入图片描述

注：这是第 t 帧图像中 x 坐标的质心

然后可以得到

在这里插入图片描述

第二招：减去每帧中二维点的质心。（中心化）

在这里插入图片描述

在这里插入图片描述

1）从方程中移除了未知的相机位置。

2）更重要的是，我们现在可以把一切写成一个大矩阵方程…

形成中心图像点矩阵

在这里插入图片描述
在一帧图像中的所有 N 个点

在这里插入图片描述

在所有 F 帧图像中跟踪一个点

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

W：中心测量（观测）矩阵；
M：“运动”（相机的旋转）
S：结构（3D 场景点）

秩理论：
2F×N 中心观测矩阵的秩最多为3

证明：

使用性质：

• mxn 矩阵的秩最多为min（m，n）

• A*B 的秩最多为min（秩（A），秩（B））

一个矩阵的秩

一个矩阵的秩是多少，如何定？

线性独立的列（行）数。

如果将矩阵A看作线性映射，则秩就是被映射到的空间的内在维数。

在这里插入图片描述

因子分解秩理论

秩理论的重要性

• 表示视频数据高度冗余

• 精确量化冗余

• 提出求解SFM的算法

因子分解方法

测量矩阵 W 的SVD形式

在这里插入图片描述

D：特征值按降序排列的对角矩阵

在这里插入图片描述

另一个有用的秩性质：
矩阵的秩等于非零特征值的个数。
d11, d22, d33 是仅有的非零特征值（其他都为0）

在这里插入图片描述
特征值按降序排列

在这里插入图片描述
前面三个为非零特征值，其他都为0

在实际应用中，由于噪声的存在，可能存在3个以上的非零特征值，但秩定理告诉我们，除了最大的3个特征值外，其余的都要忽略。

在这里插入图片描述

在这里插入图片描述
W：被观测的图像点
M：相机运动
S：场景结构

烦人的细节

在这里插入图片描述

问题：
1）这个分解不唯一

例：（M Q）（Q-1S）=mq Q-1s=ms

2）它，jT 对（也就是矩阵 M 的行）不一定是正交的

解决烦人的细节

以上两个问题的解决方法：

求 Q，使 M 的行满足：

在这里插入图片描述

3N 个方程，9个未知数

但这是非线性方程：使用线性化和迭代（GN方法）

因子分解总结
假设：

正投影相机
在 F(>=3) 个帧上进行 N 个非共面点的跟踪

形成中心测量矩阵在这里插入图片描述

其中：

在这里插入图片描述

mxi和myj是第i帧中点的平均值

j的范围是一组图像点

秩理论：中心测量矩阵的秩至多为3

因子分解算法

1）从F帧上跟踪的N个点中形成中心测量矩阵W。
2）计算W的SVD

在这里插入图片描述

U： 2F×2F
D：2F×D
V：N×N

3）取最大的三个特征值，然后组成
D’ ：33 最大特征值的对角矩阵
U‘ ：2F3 U矩阵中对应的列向量
V’T：3*N VT矩阵中对应的对应的航向量

4）定义：

在这里插入图片描述

5）求解使矩阵 M 的某些行正交的矩阵 Q

6）最终解为：

在这里插入图片描述

关注

1
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
【计算机视觉】Lecture 25：运动中恢复结构（SfM）

SfM给定一组随时间变化的运动相机的流场或位移矢量，确定：• 相机位姿的序列• 场景的三维结构SFM “Killer App”Match Move通过一个视频帧序列跟踪一组特征点推断相机的位置和被跟踪特征点的三维位置根据场景/相机推导出的三维几何来渲染合成对象因子分解FactorizationTomasi and Kanade, “Shape and Motion from ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。