计算机视觉里的多目几何-day1

最新推荐文章于 2022-08-30 11:04:48 发布

DuinoDu

最新推荐文章于 2022-08-30 11:04:48 发布

阅读量1k

点赞数 1

分类专栏：读文章文章标签：数学计算机视觉

本文链接：https://blog.csdn.net/duinodu/article/details/51517847

版权

读文章专栏收录该内容

17 篇文章 0 订阅

订阅专栏

Projective Geometry and Transformations of 2D (Day1)

带上“数学”这把斧头，在立体视觉的世界里，披荆斩棘。 —佚名

本文逻辑结构：

首先，总括看完本章的整体感受。
然后，梳理作者的逻辑。
再次，掩书而思。
最后，写写课后题。

Section 1

本章用了4天看完，总共40页，大概10页/天的进度。最大的感受是，引入Projective Plane这个数学表达，把2D中的点和线都统一用一个三元组（3x1向量）来表示，并且从这个层面上说，点和线是共轭的(conjugate)。除了描述点和线，还描述了圆锥曲线(conic)，最精彩的地方在于，conic联系了点和线。一个对象集合是{点，线，曲线}，另一个对象集合是{投影(Projective)，仿射(Affine)，相似(Similarity)，欧几里得(Euclidean)}四个层面的变换(transformation)，这是本章的两个研究对象。前者用向量或者矩阵表示，后者全部用矩阵表示。而且对于后者，矩阵的实际意义体现为一种变换（一种动态的变化，而且这种变化与时间无关，是一种瞬间发生的变化），矩阵里的特征值理论可以派上用场。

梳理本章的逻辑结构，有利于深入理解两个对象集合之间的关系，以及集合内部各个对象之间的关系。这种关系总是可以用数学完美地表达出来。对于下一章，这就非常顺其自然地推广了。

Section 2

几何问题的研究方法

纯几何方法（coordinate-free viewpoint）,一个典型的例子是经典的欧拉方法。
代数方法（algebraic viewpoint），由于笛卡尔引入了坐标系。

点，线，曲线在2D投影平面上的表示

对于直线 $ax+by+c=0$ ，对应的表示形式是 $=(a,b,c)^T$ （记为 $\mathbf{l}$ ）。对于点 $(x,y)$ ，对应到投影平面的形式是 $(x,y,1)$ （记为 $\mathbf{x}$ ）。这样一来，“点在直线上”的原始表达 $ax_0+by_0+c=0$ 可以表达成 $(x,y,1)(a,b,c)^T=0$ ，即 $\mathbf{x}^T\mathbf{l}=0$ 。

$(x,y,1)$ 和 $(a,b,c)$ 都是齐次的，也就是说， $k(x,y,1)$ 和 $(x,y,1)$ 表示的是同一个点， $k(a,b,c)$ 和 $(a,b,c)$ 表示的是同一条直线。正是因为齐次性，这种表达方式（后面都称作“投影表示法”）才能够保持2D中的点和直线的自由度（自由度=2）。所以，通常把 $(x, y, 1)$ 写成 $(x_1, x_2, x_3)$ ，后者和前者的关系是 $(x_1/x_3, x_2/x_3, 1)$ 。