双目立体视觉和体积度量

最新推荐文章于 2024-08-15 18:01:06 发布

小白学视觉

最新推荐文章于 2024-08-15 18:01:06 发布

阅读量122

点赞数

文章标签：数码相机

原文链接：https://mp.weixin.qq.com/s?__biz=MzU0NjgzMDIxMQ==&mid=2247616077&idx=2&sn=6183f63975577e0af0eab662b7b49421&chksm=fa747e8a650a8b70cc26de6bdc2ca05bdb5d7dc826ba35e7ec668611f21d21ef4b025e828dd0&scene=126&sessionid=0

版权

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

作者：Yauheni Marushko

编译：ronghuaiyang（AI公园）

导读

一个双目立体视觉的常用应用场景的介绍，很基础。

立体视觉

立体视觉意味着人工智能可以通过一对相机来感知图像的深度以及物体的距离。大多数三维相机模型都是基于立体视觉理论和技术的。两台摄像机之间设置一定的距离，这样它们就可以从不同的角度“看”物体。评估两个图像之间的对应关系，人工智能确定到目标的距离，分析，并建立目标的3D结构。

采用立体视觉，不需要红外传感器、声波定位仪、激光雷达等测距传感器，可大大降低了技术解决方案的成本。

主要应用场景：

1、人体姿态和手势识别。

2、3D模型和3D场景的构建。

3、自动驾驶系统的障碍定位和检测。

每个特定的场景都可以改动以解决特定的问题。因此，3D场景重建可以用来测量物体或产品的体积。

在实践中，立体视觉通过两台摄像机分四个阶段实现：

1、畸变校正 — 一种去除图像上透镜的径向和切向畸变的数学方法，以获得未失真的图像。

2、在校正过程中调整相机之间的角度和距离。结果是直线对齐和细化图像，即同一平面的两幅图像共面，其直线对齐方向相同，具有相同的y坐标。

3、点匹配过程 — 搜索左、右摄像头点之间的对应关系。在那之后，你会得到有一个视差图 —— 其中的值对应于左右摄像机同一点的图像x坐标的差异。

4、因此，有了相机的几何排列，我们产生了视差图的三角度量。这是重投影阶段，形成深度图，也就是想要的3D场景。

对于前两个阶段，你必须首先计算这一对相机的配置参数。这可以通过各种二值化的标定板自动完成，比如ArUco或ChArUco。这些标定板的主要优点是，即使是单个标定板也能提供足够的一致性来获得相机的姿势。此外，内部的二进制编码使它们特别可靠，因为它可以进行错误检测和纠正。你也可以使用标定板来确定相机下区域的几何形状。

体积度量

为了度量体积，你还需要进行下面的步骤：

1、对一组连续的帧进行累积，这将增加错误恢复的弹性，用于对3D场景进行平均或细化。

2、只在场景中选择产品定义的点。这是通过使用颜色分割、模板匹配或神经网络语义分割来实现的。最快的方法是颜色分割。该方法的缺点是将设置绑定到特定的产品上，如果背景颜色和对象不是很清楚，可能会产生不好的结果。如果GPU优化是可能的，那么使用U形卷积神经网络如U-net和高级U-net，或全卷积神经网络会有较高的性能和分割精度。

3、对一个由产品定义的3D点组成的场景进行聚类。每个簇是一个对象。

4、为每个簇形成一个凸多边形，消除3d场景对象的边缘缺陷

5、使用线性插值恢复缺失的3D点

6、通过基于场景的几何聚类区域积分来计算单个对象的体积。

7、最后，计算所有物体的总体积。

英文原文：https://medium.com/@softarex/computer-vision-stereo-vision-and-volume-measurement-910c381f0f75

声明：部分内容来源于网络，仅供读者学习、交流之目的。文章版权归原作者所有。如有不妥，请联系删除。

下载1：OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复：扩展模块中文教程，即可下载全网第一份OpenCV扩展模块教程中文版，涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。


下载2：Python视觉实战项目52讲
在「小白学视觉」公众号后台回复：Python视觉实战项目，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。


下载3：OpenCV实战项目20讲
在「小白学视觉」公众号后台回复：OpenCV实战项目20讲，即可下载含有20个基于OpenCV实现20个实战项目，实现OpenCV学习进阶。


交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~

小白学视觉

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
双目立体视觉和体积度量

点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达作者：Yauheni Marushko编译：ronghuaiyang（AI公园）导读一个双目立体视觉的常用应用场景的介绍，很基础。立体视觉立体视觉意味着人工智能可以通过一对相机来感知图像的深度以及物体的距离。大多数三维相机模型都是基于立体视觉理论和技术的。两台摄像机之间设置一定的距离，这样它们就可以从不同的角度“看”物体。评估两...
复制链接

扫一扫