一文聊聊用于机器感知的3D与2D传感器数据 | 数据标注

人类和机器之间最大的区别之一在于我们感知周围环境的方式。我们都存在于3D世界中,人类天生能够感知复杂的几何形状、透视、遮挡、消失点、物体持久性等带来的影响,但机器却很难处理这些最简单的情况。

想让他们能够“看到”仍然是一个热门的研究领域。机器理解它们所感知事物的能力有限,但他们努力在观察之间“连接点”。我们试图通过模仿我们自己的学习行为来教会他们——通过提供视频数据流并期望他们从中学习。可悲的是,这已被证明仅对有限数量的任务有用。

为什么我们的感知算法需要使用3D数据

简而言之,我们无法在2D表示中真正捕捉3D对象的本质。这个数字泄露了它——你在这个过程中失去了一个完整的维度——即“深度”。人类知道几何投影是如何工作的,并且对距离和透视如何影响不同物体的外观有一个心智模型。这使我们能够估计它们的相对位置、大小和方向,甚至从单个图像中。但机器还没有到达那里。

为了尝试弥合这一差距,人们正在尝试使用能够提供环境完整3D表示的各种传感器。其中,激光雷达、雷达和超声波是最受欢迎的选择,每一种都有自己的优点、缺点和应用。

使用3D数据的挑战

至于生活中的一切,使用3D数据有两个方面。获得额外的维度确实是有代价的。一些主要挑战包括:

复杂且昂贵的传感器

不管怎样,钱是其中一个因素。支持3D数据的传感器在构建复杂性和相应的价格方面差异很大,从数百美元到数千美元不等。选择它们并不便宜,特别是考虑到您通常需要多个单元以保证足够大的视野。

低分辨率数据

在许多情况下,3D传感器收集的数据远不及传统相机的数据密集或高分辨率。在激光雷达的情况下,标准传感器将垂直空间离散化为行(行数不同),每个传感器都有数百个检测点。这产生的数据点比标准高清图片中包含的数据点少约1000倍。此外,由于激光束传播的锥形形状,物体距离越远,落在其上的样本就越少。因此,检测物体的难度随着它们与传感器的距离呈指数增长。

技术上具有挑战性的数据表示

使用3D数据本身就是一项挑战。与相机提供的瞬时数据采集相比,某些3D传感器可能会由于往返时间而在信号感应和注册之间遇到延迟,尤其是当传感器放置在快速行驶的汽车上时。对于旋转传感器,例如360度LiDAR,需要进行额外的校正,以消除运动引起的失真。

尽管有这些难点,3D数据还是存在一些重要的优势:

自然表现

使用3D传感器时,记录的数据呈现出现实世界的数字克隆,它提供了一些非常有用的属性。在2D投影中,透视会改变对象的外观及其感知大小,而在3D中,无论与传感器的距离如何,它们都具有与其真实世界尺寸一致的大小。此外,可以估计物体相对于传感器位置的准确方向。

准确的位置测量

3D映射方法经常用于以极高的精度测量对象的位置。LiDAR 传感器的激光和雷达的电磁波都能够提供有关遇到障碍物的确切距离的信息,从而可以访问“深度”维度。这使算法能够对整个场景、其中对象之间的距离以及最重要的 - 没有障碍物的区域进行推理。

不受光照条件的影响

凸轮图像还有另一个主要缺点——光照条件对采集数据的质量有极大的影响。一天中的时间以及某些天气条件可能会产生负面影响,并且会显着降低传感器的有效范围或使其完全无用。相比之下,3D传感器不受光照条件的影响,可以保证一致的高质量数据流。

如果您需要获取2D图像数据和3D点云数据,欢迎联系我们!

景联文科技作为长三角地区规模最大的AI基础数据服务商之一,拥有专业、高素质的全职采集标注团队,针对定制化程度高、标注情况多而复杂的项目,景联文科技自建数据标注平台与成熟的标注、审核、质检机制,支持支持计算机视觉(拉框标注、语义分割、3D点云标注、关键点标注、线标注、2D/3D融合标注、目标跟踪、图片分类等)、语音工程(语音切割、ASR语音转写、语音情绪判定、声纹识别标注等)、自然语言处理(OCR转写、文本信息抽取、NLU语句泛化)多类型数据标注。平台还具有自动标注功能,可对图像进行预处理,根据标注结果调整模型进行标注,根据场景灵活配制标注流程,进一步保证了标注精度。

景联文科技|AI基础数据服务|数据采集|数据标注|假指纹制作|指纹防伪算法

助力人工智能技术加速数字经济相关产业质量变革,赋能传统产业智能化转型升级

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值