教你如何提高双目立体视觉系统的精度

点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

来源:https://blog.csdn.net/rs_lys/article/details/107102968

开源代码免费获取,欢迎关注作者的GitHub: https://github.com/ethan-li-coding

双目立体视觉(Binocular Stereo Vision)是机器视觉的一种重要形式,它是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息的方法1

精度,是双目立体视觉至关重要的指标。

双目立体视觉系统,不谈精度几许,未免显得业余!

精度不行

“来,小同志往边上让一让,下一个!”

精度很高

“小伙子你们设备多少钱!能打个折不!”

做过双目研究的伙伴们,肯定是经常和精度打交道的,大部分人也肯定知道,双目立体视觉的精度主要看的是深度方向的精度!深度图是很多双目设备的输出数据,通过深度图以及相机参数,可以算出三维点云的空间坐标,公式如下:

可知深度DDD的角色感很强,把深度估计准了,那三维点也就准了。(什么,相机标定也不准?当我没说!)

所以,如何让深度精度更高?

我们再来看一个经典公式:


这可再熟悉不过了,DDD是深度,BBB是基线,fff是焦距(像素单位),ddd是视差。咱们一分为二看这个公式,右边分母部分是像素视差值,和算法相关;分子部分是系统硬件参数,和硬件相关。

可知深度精度是由算法和硬件综合决定。

研发:“哥们,你们硬件做的不行啊!”
硬件:“屁,是你们算法不行!”
老板:“都是废物!”

对各参数不太清楚的同学可以看下图:

1 算法因素

咱们先分析算法对精度的影响。那么硬件参数BBB和fff就假设是已知且恒定的了。

假设视差偏差为ΔdΔdΔd,则计算视差偏差ΔdΔdΔd下的深度偏差ΔDΔDΔD

BBB和fff已知且恒定,如果我们把DDD也恒定,也就是在同一个深度距离下评判精度,由公式(1)可知ddd也就恒定。此时容易发现,ΔdΔdΔd越小,ΔDΔDΔD越小。说明:

(一)视差偏差越小,深度偏差越小;换言之,算法的视差精度越高,深度精度越高,深度精度和视差精度成正比

所以更高精度的视差估计算法,自然能带来更高的深度精度。

2 硬件因素

上面分析算法对精度的影响,所以固定了硬件参数BBB和fff。现在我们来分析视差精度恒定的情况下,硬件参数如何影响精度。还是基于上面三个公式,但是做一些修改,把公式(1)代入到(3)中,如下:

同样,我们把DDD恒定,也就是在同一个深度距离下评判精度,因为视差精度恒定(也就是视差估计算法定了,精度差不多固定了),因此ΔdΔdΔd也恒定。不难发现,BBB和fff对DDD有相同的影响关系,BBB越大、fff越大,ΔDΔDΔD越小。说明:

(二)基线越大、焦距(像素单位)越长,深度精度越高。深度精度和基线、焦距成正比。

从公式中我们看到,影响ΔDΔDΔD的实际是基线和焦距的乘积,所以若两个一起增大,那深度精度必然增大,若一个增大一个减小,那么深度精度可能增大也可能减小。

另一个需要说明的是,fff是焦距的像素单位,它和焦距的空间尺寸和像素大小有关,设焦距的空间尺寸为f0f_0f0,像素大小为sss,则fff的计算公式为:

显然,sss越小,fff越大。我们知道sss的大小是相机传感器尺寸决定的,而焦距是镜头决定的。所以选相机的时候要了解第三个知识:

(三)像素大小越小,同样的物理尺寸焦距有更长的像素尺寸焦距,深度精度就越高。

3 深度范围

上面我们分析了算法参数和硬件参数对深度精度的影响,但还有一个重要的因素,它即非硬件相关也非算法相关,它就是深度本身的大小,也即深度范围。简单的说,目标离镜头的距离不同,精度是不一样的。

对上一节的公式(3)再多做一步推导:

这里讨论深度范围,所以假设BBB、fff和ΔdΔdΔd都恒定。显然可以发现,DDD越小,ΔDΔDΔD越小。所以我们得出第四个结论:

(四)测量目标离系统越近,深度精度越高。

4 总结

我想大家其实在实际应用中都会有一些直观的理解,比如(1)算法越好,精度越高,明摆着嘛!(2)相机分辨率越高,精度越高,这不废话嘛!(3)基线越长,精度越高,显而易见嘛!

本文的目的就是通过公式推导来严格证明,以让大家更加清晰的明白各因素影响精度的本质,从而更科学的指导双目系统的设计。再来汇总一下上面的四条结论:

(一)视差偏差越小,深度偏差越小;换言之,算法的视差精度越高,深度精度越高,深度精度和视差精度成正比。.

(二)基线越大、焦距(像素单位)越长,深度精度越高。深度精度和基线、焦距成正比。

(三)像素大小越小,同样的物理尺寸焦距有更长的像素尺寸焦距,深度精度就越高。

(四)测量目标离系统越近,深度精度越高。

所以同学们你们现在知道怎么设计双目系统能提高精度了吗?

1、选高精度视差估计算法

2、在应用场景允许、结构稳定性满足需求的情况下,尽可能延长基线

3、在视场范围、景深满足需求的情况下,尽可能选择长焦镜头

4、在算力允许的情况下,选择高分辨率相机(本质上应该是像素尺寸小的相机,有的相机提高了分辨率,只是提升了视域,但像素尺寸不变,那精度也不变)

5、测量距离适当拉近(这点往往是场景需求决定的)

备注:本文作者松博在哔哩哔哩做的立体匹配直播视频:

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉优质源码即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

 圈里有高质量教程资料、可答疑解惑、助你高效解决问题

整理不易,请给工坊点赞和在看

  • 4
    点赞
  • 48
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值