YOLOP 论文笔记

最新推荐文章于 2024-05-09 09:24:31 发布

Tianchao龙虾

最新推荐文章于 2024-05-09 09:24:31 发布

阅读量768

点赞数

分类专栏： 2D目标检测论文笔记车道线检测论文笔记实例分割论文笔记文章标签：自动驾驶深度学习计算机视觉

本文链接：https://blog.csdn.net/wuchaohuo724/article/details/120821694

版权

21 篇文章 3 订阅

订阅专栏

19 篇文章 5 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

YOLOP: You Only Look Once for Panoptic Driving Perception

YOLOP

论文链接: https://arxiv.org/abs/2108.11250v5

自动驾驶中，如果使用一个接一个模型来进行图像分析，比如目标检测，语义分割和车道线检测，会增大消耗资源，也有可能无法达到实时性能。

提出一个通用范式: one encoder backbone + three prediction heads。这个模型分别用于目标检测，可通行区域分割和车道线分割。整体的模型框架如下:

作者采用CSPDarknet，SPP和FPN的一个组合作为encoder。

Detect Head
类似于YOLOv4，作者使用了path aggregation network(PAN)和anchor-based的检测头。
Drivable Area Segment Head & Lane Line Segment Head
可通行区域的检测头和车道线分割的检测头都是同样的网络结构。使用FPN最后一层作为输入，维度为: $(W / 8, H / 8, 256)$ 。使用Nearest Interpolation Method进行上采样，恢复输出分辨率为: $(W, H 2)$ 。

先来看一下整体的Loss function:
$L_{all} = \gamma_1 L_{det} + \gamma_2 L_{da-seg} + \gamma_3 L_{ll-seg}$

上面的式子包含三个部分:

$L_{det}$ 是目标检测的损失函数。包括三个部分:classification loss，object loss，和bounding box loss。
$L_{det} = \alpha_1 L_{class} + \alpha_2 L_{obj} + \alpha_3 L_{box}$
其中， $L_{class}, L_{obj}$ 使用Focal Loss， $L_{box}$ 是CIoU Loss。
$L_{da-seg}$ 和 $L_{ll-seg}$ 都使用Cross Entropy Loss。但是对于车道线分割，它还多了一项IoU Loss: $L_{IoU} = \frac{TN}{TN+FP+FN}$
$L_{da-seg} = L_{ce} \\ L_{ll-seg} = L_{ce} + L_{IoU}$

同时使用一个backbone，不同的prediction heads来进行end-to-end训练。效果都分别达到SOTA，思路较为简单。

关注

专栏目录