为什么structure from motion只能提取出物体的比例信息？

最新推荐文章于 2022-11-29 11:40:10 发布

_rho

最新推荐文章于 2022-11-29 11:40:10 发布

阅读量253

点赞数

分类专栏：计算机视觉文章标签：三维重建 SFM 计算机视觉

本文链接：https://blog.csdn.net/u012841922/article/details/105252880

版权

计算机视觉专栏收录该内容

18 篇文章 1 订阅

订阅专栏

首先，构建一个相机移动的模型。假设相机通过旋转矩阵 $R$ 和位移向量 $T$ 从 $p_{r}$ 的位置移动到 $p_{l}$ 的位置。世界坐标系中的物体 $P$ 在不同位置的相机坐标系中的坐标是 $P_{r}$ 和 $P_{l}$ 。 $P$ 和 $P_{l}$ 、 $P$ 和 $P_{r}$ 之间的替换公式为：

$\begin{bmatrix} X_{l} \\ Y_{l} \\ Z_{l} \end{bmatrix} = P_{l} = R_{l}P + T_{l} = R_{l} \begin{bmatrix} X \\ Y \\ Z \end{bmatrix} + T_{l} \\ \begin{bmatrix} X_{r} \\ Y_{r} \\ Z_{r} \end{bmatrix} = P_{r} = R_{r}P + T_{r} = R_{r} \begin{bmatrix} X \\ Y \\ Z \end{bmatrix} + T_{r}$

在这里插入图片描述

$P_{l}$ 和 $p_{l}$ 、 $P_{r}$ 和 $p_{r}$ 之间的替换公式为：

$\begin{bmatrix} x_{l} \\ y_{l} \\ 1 \end{bmatrix} = p_{l} = \frac{1}{Z_{l}} K_{3 \times 3}P_{l} = \frac{1}{Z_{l}} K_{3 \times 3} \begin{bmatrix} X_{l} \\ Y_{l} \\ Z_{l} \end{bmatrix} \\ \begin{bmatrix} x_{r} \\ y_{r} \\ 1 \end{bmatrix} = p_{r} = \frac{1}{Z_{r}} K_{3 \times 3}P_{r} = \frac{1}{Z_{r}} K_{3 \times 3} \begin{bmatrix} X_{r} \\ Y_{r} \\ Z_{r} \end{bmatrix}$

由于structure from motion只能得到相机位移向量 $T$ 同方向的单位向量 $u$ ，所以真实的 $T = k u$ ，其中 $k$ 是一个未知正常数。 $P_{l}$ 和 $P_{r}$ 之间的替换公式为：

$\begin{bmatrix} X_{r} \\ Y_{r} \\ Z_{r} \end{bmatrix} = P_{r} = RP_{l} + T = R \begin{bmatrix} X_{l} \\ Y_{l} \\ Z_{l} \end{bmatrix} + ku$

通过特征点匹配、光流等得到 $p_{l}$ 和 $p_{r}$ 之间的像素位移，可构建等式：
$\begin{bmatrix} \triangle{x} \\ \triangle{y} \\ 0 \end{bmatrix} = p_{l} - p_{r} = K_{3x3}(\frac{1}{Z_{l}}\begin{bmatrix} X_{l} \\ Y_{l} \\ Z_{l} \end{bmatrix} - \frac{1}{Z_{r}}\begin{bmatrix} X_{r} \\ Y_{r} \\ Z_{r} \end{bmatrix}) \\ = K_{3x3}(\frac{1}{Z_{l}}\begin{bmatrix} X_{l} \\ Y_{l} \\ Z_{l} \end{bmatrix} - \frac{1}{f(Z_{l})}(R \begin{bmatrix} X_{r} \\ Y_{r} \\ Z_{r} \end{bmatrix} + ku)) \\ = K_{3x3}((\frac{1}{Z_{l}} - \frac{R}{f(Z_{l})})\begin{bmatrix} X_{l} \\ Y_{l} \\ Z_{l} \end{bmatrix} - \frac{ku}{f(Z_{l})})$

上式为带有4个自变量 $X_{l}$ 、 $Y_{l}$ 、 $Z_{l}$ 和 $k$ 的三个等式。由于剩下一个自由度，structure from motion只能提取出景物的比例信息。（stereo vision可以确定 $k$ 值，上式便仅有三个自变量 $X_{l}$ 、 $Y_{l}$ 和 $Z_{l}$ ，因此可以确定景物的尺寸信息。）

_rho

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
为什么structure from motion只能提取出物体的比例信息？

首先，构建一个相机移动的模型。假设相机通过旋转矩阵RRR和位移向量TTT从prp_{r}pr的位置移动到plp_{l}pl的位置。世界坐标系中的物体PPP在不同位置的相机坐标系中的坐标是PrP_{r}Pr和PlP_{l}Pl。PPP和PlP_{l}Pl、PPP和PrP_{r}Pr之间的替换公式为：[XlYlZl]=Pl=RlP+Tl=Rl[XYZ]+Tl[XrYrZr]=Pr=RrP+Tr=Rr[XYZ]+Tr\begin{bmatrix} X_{l} \\ Y_{l} \\ Z_{l} \
复制链接

扫一扫