计算机视觉基础知识(七)--立体视觉

本文介绍了立体视觉,一种基于多幅图像获取深度信息的计算机视觉技术,重点讲解了双目系统的工作原理,利用视差原理计算深度,以及在机器人、自动驾驶和无人机领域的应用。单目系统受限于无法提供深度信息,而双目系统通过三角测量提供了深度感知的能力。
摘要由CSDN通过智能技术生成

1.立体视觉

立体视觉定义

  • 一种计算机视觉技术;
  • 目的是从两幅或以上的图像中推理出图像中每个像素点的深度信息;

立体视觉应用领域

  • 机器人;
  • 辅助驾驶/无人驾驶
  • 无人机

立体视觉的原理

  • 借鉴了人类双眼的“视差”原理;
  • 左、右眼对于物体的观测存在差异;
  • 大脑利用左、右眼的差异,使得人类能够辨识物体的远近。

单目系统

  •  O为相机的光心;
  • \pi是摄像头的成像平面;
  • P和Q为空间中的两个点;
  • 缺点:对重合的两个点P和Q无法提供深度信息

2.双目系统&视差

双目系统

  • 极平面:O_R,O_T,P三个点确定的平面;
  • 极点:O_R,O_T连线与像平面\pi_R,\pi_T的交点e_1,e_2;
  • 基线(baseline):O_RO_T;
  • 极线:极平面与两个像平面之间的交线L_1,L_2

视差推导

  • 根据三角形相似定理:\Delta Ppp'\sim \Delta PO_RO_T ;
  • \frac{B}{Z}=\frac{pp'}{Z-f}=\frac{B-(X_R-\frac{W}{2})-(\frac{W}{2}-X_T)}{Z-f}=\frac{B+X_T-X_R}{Z-f};
  • Z=\frac{B\times f}{X_R-X_T}=\frac{B \times f}{D};
  • 其中D就是我们所说的视差(disparity)

视差Didparity

  • 将同一空间的物理点在不同图像中的映像点对应起来,同一物理点在不同图像中的映像点之间的差别,称为视差;
  • Z=\frac{B\times f}{X_R-X_T}=\frac{B \times f}{D};

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值