单目视觉技术、双目视觉技术、多目视觉技术

最新推荐文章于 2024-07-15 15:09:30 发布

fengxuewei123

最新推荐文章于 2024-07-15 15:09:30 发布

阅读量1.1w

点赞数 4

分类专栏：笔记

原文链接：https://blog.csdn.net/xholes/article/details/79687230

版权

笔记专栏收录该内容

14 篇文章 0 订阅

订阅专栏

计算机视觉、人工智能视觉的研究过程：感知、认知、和控制

车载摄像头的要求：
看得远：提供了更充足的反应时间，直接提升了安全性。需要长焦距（D大，欲保持其他地方不变，就需要F增大），但是焦距增加会导致视角变窄（当F增大，那么W就会减小）
质量高：为了识别的准确率。要求成像效果

相机坐标系

相机坐标系是以相机的聚焦中心为原点，以光轴为Z轴建立的三维直角坐标系。
相机坐标系（观察坐标系）相机坐标系的原点为相机的光心，x轴与y轴与图像的X,Y轴平行，z轴为相机光轴，它与图形平面垂直。光轴与图像平面的交点，即为图像坐标系的原点，图像坐标系为二维直角坐标系。

xy平面和之前平面直角坐标系的表述一致
z 轴与光轴重合
在这里插入图片描述

单目摄像头：

识别目标 — 测距
需要大量的数据，并且不断更新和维护

应用于自动驾驶的路况判断

双目摄像头：

通过两幅图像的视差计算来确定距离，类似人的双眼，不需要知道障碍物是什么。
靠计算来进行测距，最大的难点在于计算量巨大

单目测距原理

焦距： $\times D ) / W$
在这里插入图片描述

单目视觉

参考链接
单目视觉获得的图像本质上是2D的，结合相机的成像模型（初中物理，小孔成像）j就可以获知距离了，前提是你知道物体的真实大小。

在这里插入图片描述

测距

case 1: 物体在摄像机的正前方(光轴上)，即相机坐标系的y轴上。

$\frac{f}{D} = \frac{h}{H}$
其中，
f 为焦距(相机的内参数，一旦相机确定了，这个数值基本就是确定了)、
h是在相平面内的成像高度
D为物体到相机的距离
H为物体的实际高度（可以获取）

D为所求量，那么h的获知就成为了关键，是通过摄像机内部的感知元件作用后保留下来的

若知道，每一个感知原件的物理尺寸 $\delta$ 和像中包含的感知原件的个数 $n$ ，那么就能够得知像的高度 $\delta$

则， $\frac{f}{D} = \frac{n \cdot \delta}{ H }$ $\frac{f \cdot H}{n \cdot \delta}$

case 2: 物体在摄像机坐标系的xy平面上有偏移（在x轴上有值）

光心
在这里插入图片描述
那么物体成像并不是在图像的中间部分，而会在中间偏左或者偏右的位置，存在一个水平方向的夹角 $\alpha$ ，此时光心到像平面中心的距离与光心到物体的距离满足 case 1 的模型，即有：
$D^{'} = \frac{f^{'} \cdot H}{n \cdot \delta}$ $f^{'} = \sqrt{f^2 + l^2}$ $n_{x} \cdot \delta$

$\alpha = arctan(\frac{l}{f})$

其中 $f^{'}$ 表示焦距， $D^{'}$ 表示光心到物体中心的距离， $l$ 表示像中到图像中心的水平偏移距离， $n_{x}$ 表示水平偏移的像素个数

在这里插入图片描述

此时，可以得到物体到摄像机的距离为：
$D^{'} \cdot cos\alpha = \frac{H \cdot \sqrt{f^{2} + (n_{x} \cdot \delta)^2}}{n \cdot \delta} \cdot \frac{f}{ \sqrt{f^{2} + (n_{x} \cdot \delta)^2}} = \frac{H \cdot f}{n \cdot \delta}$