车道线检测-BezierLaneNet-CVPR2022论文学习笔记

tomeasure

已于 2022-08-10 17:44:49 修改

阅读量1.5k

点赞数 1

分类专栏：目标检测 CV 文章标签：学习机器学习算法车道线检测

于 2022-07-31 19:13:26 首次发布

本文链接：https://blog.csdn.net/qq_29695701/article/details/126089209

版权

CV 同时被 2 个专栏收录

24 篇文章 2 订阅

订阅专栏

目标检测

19 篇文章 1 订阅

订阅专栏

论文：《Rethinking Efficient Lane Detection via Curve Modeling》
代码：https://github.com/voldemortX/pytorch-auto-drive
地址：https://arxiv.org/abs/2203.02431
内容：使用 CNN，基于贝塞尔曲线拟合车道线

整体结构

在这里插入图片描述

特征提取器：三层 ResNet 结合 RESA 模块。
特征提取器上还要加一个辅助分支：分割分支

模型输出的东西

贝塞尔曲线的四个控制点 $\mathcal{P}_i$ ，以及车道线的存在性。

三阶贝塞尔曲线的表达式：

$\begin{align} \mathcal{B}(t)&=\Sigma^3_{i=0}\ b_{i,3}(t)\cdot\mathcal{P}_i,\ \ \ \ 0\le t\le 1\\ b_{i,n}&=C^i_{n}t^i(1-t)^{3-i},\ \ \ \ i=0,1,2,3 \end{align}$

特征的水平翻转融合

试图利用车道线的对称性（这部分起效的原因很值得探讨）。
在这里插入图片描述

整体的损失函数

主要分为三部分：回归、分类、分割：

$\mathcal{L}=\lambda_1 \mathcal{L}_{reg}+\lambda_2 \mathcal{L}_{cls}+\lambda_3 \mathcal{L}_{seg}$

其中，

分割的损失函数 $\mathcal{L}_{seg}$ 不再赘述；
$\mathcal{L}_{cls}$ 使用一个权重控制正负样本之间的数据不平衡：
$\mathcal{L}_{cls}=-y\log p-w\cdot(1-y)\log (1-p)$
$\mathcal{L}_{reg}$ 是预测曲线与 GT 之间的距离，表达式如下：
$\mathcal{L}_{reg}=\frac{1}{m}\Sigma_{i}L_1(\mathcal{B}(t_i),\hat{\mathcal{B}}(t_i))$

其中， ${t_i\}$ 是 $t$ 在 $[0, 1]$ 上的均匀采样，每条车道线 $m$ 个样本。

注意：

由于模型输出的是四个控制点，所以还需要将数据的 GT 转为控制点的形式。

利用最小二乘法，可以得到控制点 GT 的生成方案：
$\begin{bmatrix} \mathcal{P}_0 \\ \mathcal{P}_1 \\ \mathcal{P}_2 \\ \mathcal{P}_3 \end{bmatrix}=\begin{bmatrix} k_{x_0}\ k_{y_0} \\ k_{x_1}\ k_{y_2} \\ \vdots\ \ \ \ \ \vdots \\ k_{x_m}\ k_{y_m} \end{bmatrix} \begin{bmatrix} b_{0,3}(t_0)\ \ b_{1,3}(t_0)\ \ b_{2,3}(t_0)\ \ b_{3,3}(t_0) \\ b_{0,3}(t_1)\ \ b_{1,3}(t_1)\ \ b_{2,3}(t_1)\ \ b_{3,3}(t_1) \\ \vdots\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ddots\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \vdots \\ b_{0,3}(t_m)\ \ b_{1,3}(t_m)\ \ b_{2,3}(t_m)\ \ b_{3,3}(t_m) \end{bmatrix}^T$

GT 与模型预测结果之间的匹配（Hungarian 算法求解）：
$\hat{\pi}=\mathop{\arg\max}_{\pi\in\Pi^N_G}\ \Sigma^G_i\ (\hat{p}_{\pi(i)})^{1-\alpha}\cdot(1-L_1(b_i,\hat{b}_{\pi(i)}))^\alpha$

其中，GT的数量是 G，预测出的数量是 N，且 $G < N$ ； $\pi(i)$ 是与第 $i$ 个 GT相匹配的第 $\pi$ 个预测。