立体视觉的新旧概念

立体视觉或双目视觉是计算机视觉中的一个难点,有很多教程,如SfM方面,但结合基础和现实应用,缺乏一个方便理解和自包含的教程。本文探讨这个问题,给出一个容易理解的思路,对比分析,回答一些本质的问题。

1. SfM理论入门不难,先统一些术语,3D坐标系按右手法则,大拇指指向上,四指伸直再弯曲,对应的坐标就是,大拇指指向 Z轴正向,四指没弯前指向X正向,弯后,相当于四指指向变了90度,指向Y正向。不管空间姿态如何,面对各种朝向出现,这样去矫正自己的空间想象就对。

比如,如果大拇指指向X正向,表示沿着围绕着X旋转,四指的弯前,弯后= 指向Y,Z的正向。如果大拇指指向Y正向,四指弯前,弯后= 指向Z,Y的正向。

在2D,右手系,X到Y,是旋转正的角度,同样的3D右手系,正的旋转角度是匹配的。这里主要为了澄清 公式中用的角度是正还是负,平移的前面是正还是负?

有些教程或软件产品采用的左手系,这里不用,避免混淆,ComputerVision一般是没有统一右手还是左手系。因为,比如旋转矩阵(3x3)在左,一个3D矢量(3x1)在右,两者相乘,按右乘法则得到新的3D矢量位置。不论是左右手系,旋转转化运算都是矩阵的右乘。但新的矢量是按左手 或右手系理解具体的正负符号(朝向),这是理解的基础, 但一般教程忽略在开始的时候专门标注清楚,它关注的是矩阵运算的公式,没有指出左右手是否区别其他的教程左右手,教程看多了没意识到他们是用的不同左右手。

2. world coordinates space 或 system, camera coordinates, image coordinates, 为什么要这几个体系的数学形式?就好像同一物质进入不同人的大脑,有自己一套语言,尺度,色彩等描述,虽说是各自表述,一个建筑物顶角脱落一块,有人说白墙脱落,有人说红色的风吹过,有人说灰色的微粒动了动,到底是同一事件发生吗?

所以 world - camera - image 是一种抽象的归一化。每人用自己的最好理解最简单的数据表示出来。不然一个巨人与一个昆虫在一起计算,使用绝对量不如归一化的相对量。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值