视觉2D感知(二):语义分割算法及在无人驾驶的应用

一.物体检测算法的不足

1.稀疏的输出结果

  • 目标物体的位置、大小、类别、速度等
  • 无法感知非物体,比如道路、建筑物、数目等
  • 无法识别可行驶区域,无法规避所有障碍物

2.粗略的物体框表示

  • 矩形框:中心点+长宽
  • 无法精确表述物体形状

3. 受限的应用场景

  • 自适应巡航
  • 自动紧急刹车
  • 盲区监测

不适用于车道保持和泊车辅助

二.语义分割

1.稠密的输出结果

  • 每个像素点的语义类别
  • 物体:实例ID+分割Mask
  • 非物体:分割Mask

2.应用场景

  • 可行驶道路检测
  • 车道线监测
  • 障碍物监测

3.最直接的方法

  • 滑动窗口遍历整幅图像
  • 对固定大小的图像块进行分类
  • 分类器:SVM或者全连接网络

问题:大量的冗余计算,无法利用上下文信息

4.全连接网络(FCN)

  • 叠加多个卷积层和下采样层
  • 逐层扩大感受野,提取不同层次的空间上下文特征
  • 最终的特征图通过反卷积恢复到原始图形的分辨率

问题:下采样导致空间细节信息的丢失,影响分类正确率和空间位置分辨率,尤其是影响细小物体

5.U-Net

  • 编码器-解码器的结构
  • 同样分辨率的特征图之间,增加了Skip连接
  • 同时保留高层的上下文特征和底层的细节特征
  • 网络通过学习来自动的平衡上下文和细节信息的比重

问题:底层特征图具有较大的感受野,但是牺牲了空间分辨率

6.空洞卷积(Dilated/Atrous Convolution)

  • 拓展标准卷积核,使其铺盖更大的空间位置
  • 代替下采样的操作:保持空间分辨率;在不增加计算量的前提下扩大感受野;

7.大卷积核

  • 增加卷积操作的感受野
  • 卷积结果的空间分辨率不受影响
  • 降低计算量的Trick:二维的大卷积核(K×K)分解为两个一维的卷积核(1×K和K×1);二维卷积的结果用两个一维卷积结果的和来模拟;计算量由 O ( K 2 ) O(K^2) O(K2)降低到 O ( K ) O(K) O(K)

8.DeepLab

  • 采用扩张卷积扩大感受野
  • 采用ASPP(Atrous Spatial Pyramid Pooling)提取多尺度信息
  • 采用条件随机场(CRF)优化分割结果

请添加图片描述

9.Mask R-CNN

  • 在Faster R-CNN的基础上增加实例分割分支
  • 对于每个ROI,利用FCN输出一个固定大小的二值Mask
  • ROI Align代替Pooling,提高特征与像素的空间对齐程度

3.自动驾驶中的应用

1车道线检测

用FCN输出一个固定大小的二值Mask

  • ROI Align代替Pooling,提高特征与像素的空间对齐程度

三.自动驾驶中的应用

1车道线检测

请添加图片描述

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

anthony-36

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值