自动驾驶采标系列六:复杂场景语义理解-交通识别检测技术

    标注猿的第57篇原创    

   一个用数据视角看AI世界的标注猿  

前几篇文章从两种数据的角度去学习了基于图片和激光雷达数据的算法,较为通俗的说明了其算法的逻辑,从而为理解其标注数据在使用算法应用时的理论基础。

其实大家会发现一个问题,作为标注员其实在一点都不理解算法的情况,我们依然可以做好数据标注工作,原因很简单,目前人工智能是从结果推方法。我们人本身就是智能体,现在想用另一种方法模拟人这个智能体。

那我们如何更好的做好标注这个事情呢?我认为的问题所在就是应该刚好的理解这个方法的底层逻辑,更好的做拟合。所以如果未来个人想在这个行业上有所发展就一定好了解这些底层逻辑。

言归正传,从本文开始会用几篇文章从场景的角度学习检测识别技术的底层逻

交通识别检测技术

交通标识检测是智能汽车辅助驾驶必须的环节,包括标牌、红绿灯、车道线等。

1.车道线是用来管制和引导交通的一种标线,包括路面上的线条、箭头、文字、标记和轮廓标识

传统基于计算机视觉的车道线检测方法依赖于高度定义话的手工特征提取和启发式的方法,目前主要分为以下两种方法:

  • 基于道路特征的检测方法

    通常依据道路与车道线不同的物理特征的区别来设计特征计算方式,突出道路特征来实现车道线检测。

  • 基于道路模型的检测方法

    即根据不同的道路几何模型(直线模型或曲线模型)实现道路的检测

当前基于深度学习的车道线检测方法,通常将车道线检测视为分割分类问题,利用神经网络代替人工设计的特征。

  1. 基于图像的检测方法

    基于图像的检测方法有LanNet和H-NET,它们将车道线检测问题转换为实例分割问题,即每个车道线均形成一个属于车道线类别的实例。

    对于一张输入的图片,LaneNet负责输出实例分割的结果,每条车道线一个标识ID,H-NET输出一个转换矩阵对车道线像素点进行修正,对于修正后的结果拟合出一个三阶多项式作为预测的车道线。

    尽管CNN具有强大的特征提取能力,但没有充分地探索图像行、列间关系的能力,而这些关系对于学习强先验形状的对象尤为重要。针对这一问题,Spatial CNN(SCNN)将传统卷积的逐层(Layer-by-Layer)连接形式转换为特征图中的逐片(Slice-by-Slice)卷积形式,使图像中像素行列之间可以传递信息,这使得它对于长距离连续形状的目标有很好的检测效果。

  2. 基于激光雷达的检测方法

    基于图像的检测方法存在对光照敏感、依赖完整且较为统一的车道线标识、有效采样点不足以及车道线被水覆盖检测失效问题,因此越来越多的研究者开始思考如何使用激光雷达传感器做车道线检测。

    相对于传统的视觉传感器,激光利达有效距离更远,且可以穿透水面,有效采样点多,基本解决了传统视觉中的大部分问题。

    基于激光雷达进行车道线检测的方法,通过提取激光雷达的集合或物理特征,利用离散数据拟合形成车道线。

    其中,Ibeo激光雷达具有三次回波技术,每个激光返回三个回波,返回的信息可以可靠地还原被检测的物体,同时能够精准分析相关物体的数据,由于路面和车道线材质不同,因此通过分析激光雷达数据能够将路面和车道线区分开来;

    其次还可以通过激光雷达反射强度值来做车道线的检测,从而分离出路面区域与车道线。

    最后,通过最小内方差算法找到路面区域与车道线的分割阈值,利用误差分析原理剔除车道线集合范围内的离群值,提取车道线特征种子点,在通过最小二乘法等拟合算法,拟合车道线。

2.红绿灯控制交通路口的通信效率和安全,是一种机器特殊且重要的交通标识。红绿灯检测即获取红绿灯在图像中的坐标以及类别,这是自动驾驶中的一个关键问题,关系到自动驾驶汽车当前的决策。

由于红绿灯这种小目标在图像中占有少量像素,对于标准神经网络来说,小物体经过多层特征提取层可能仅表现为一个点,细节丢失严重;

因此,针对红绿灯的检测,通常分为两个阶段,首先定位出红绿灯的大概位置,然后采用一定技术对相关区域进行二次的识别。

使特征提取网络更适合小目标检测,大致有如下几种方法:

  1. 图像金字塔

    针对训练图片进行上采样得到多尺度特征,从而增强小目标的细粒度特征,在理论上能够优化小目标检测的定位和识别效果。但是基于图像金字塔的方法对于计算机计算能力和内存都有很高的要求。

  2. 逐层检测

    对于卷积神经网络的每一层输出进行一次预测,最后综合考虑得到结果。但是该方法在浅层神经网络的效果并不好,因为浅层特征并没有充分的语义信息。

  3. 特征金字塔

    参考多尺度特征图的特征信息,同时兼顾了较强的语义特征和位置特征。较大的特征图负责较小物体的检测,而较小的特征图负责较大物体的检测。

  4. 空洞卷积

    利用空洞卷积代替传统卷积,不增加参数数量且不减小特征图大小,保留了更多的细节信息。

上述方法只是通过图像获取红绿灯在图像中的位置,而获取红绿灯坐标,并将红绿灯信号与车道对应起来则需要结合高精度地图。

以上就是本文对复杂场景语义理解-交通识别检测技术的介绍。有感兴趣的小伙伴也可以看《基于5G的智能驾驶技术与应用》一书,是北邮的网络与交换国家重点实验室组编,非常适合小伙伴做基础理解和行业了解为主的学习。

相关文章阅读:

  1. 自动驾驶采标系列一:自动驾驶数据采集资质及采集数据出境的调研分析

  2. 自动驾驶采标系列二:车载感知与车载传感器标定(内附标注猿专属定制新年礼品)

  3. 自动驾驶采标系列三:基于图像的目标检测技术(内附标注猿专属定制新年礼品)

  4. 自动驾驶采标系列四:基于激光雷达的目标检测方法

  5. 自动驾驶采标系列五:图像与激光雷达联合目标检测方法

下一篇文章预告:

《自动驾驶采标系列七:复杂场景语义理解-可行驶区域检测》

-----------------------完---------------------

公众号:AI数据标注猿

知乎:AI数据标注猿

CSDN:AI数据标注猿

微信号:

-----------------------完---------------------

 

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI数据标注猿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值