浅谈Anchor-Free发展历程

最新推荐文章于 2024-03-06 14:50:21 发布

置顶

VIP文章 lighten-1996

最新推荐文章于 2024-03-06 14:50:21 发布

阅读量2.4w

点赞数 6

分类专栏：深度学习

本文链接：https://blog.csdn.net/weixin_43292354/article/details/89387651

版权

1.早期探索：
DenseBox: https://arxiv.org/abs/1509.04874
YOLO: https://arxiv.org/abs/1506.02640
2.基于关键点：
CornerNet: https://arxiv.org/abs/1808.01244
ExtremeNet: https://arxiv.org/abs/1901.08043
3.密集预测:
FSAF: https://arxiv.org/abs/1903.00621
FCOS: https://arxiv.org/abs/1904.01355
FoveaBox: https://arxiv.org/abs/1904.03797v1

DenseBox:
在这里插入图片描述

如图所示，单个FCN同时产生多个预测bbox和置信分数的输出。测试时，整个系统将图片作为输入，输出5个通道的feature map。每个pixel的输出feature map得到5维的向量，包括一个置信分数和bbox边界到该pixel距离的4个值。最后输出feature map的每个pixel转化为带分数的bbox，然后经过NMS后处理。
除了nms之外，检测系统的所有组成部分都构建在FCN之中。

训练过程：
在这里插入图片描述
上图是本文的网络结构图。红色部分表示存在学习参数。前12个conv层的网络参数由VGG19模型参数直接初始化，conv4_4的输出作为后续四个1*1卷积层的输入，前两个输出的是通道1的特征图，用于分类预测，后两个利用通道4的特征图来预测bounding box的相对位置。这种有两个输出分支的结构和Fast R-CNN很相似，在第一个输出端口定义分类损失函数，在第二个定义bounding-box回归损失函数，这样就可定义完整的损失函数。

Refine with Landmark Localization：
在这里插入图片描述

在FCN结构中添加少量层能够实现landmark localization，然后通过融合landmark heatmaps和score map可以进一步提升检测结果。

贡献：
1.证明单个FCN可以检测出遮挡严重、不同尺度的目标

最低0.47元/天解锁文章

lighten-1996

关注

6
点赞
踩
83

收藏

觉得还不错? 一键收藏
4
评论
浅谈Anchor-Free发展历程

1.早期探索：DenseBox: https://arxiv.org/abs/1509.04874YOLO: https://arxiv.org/abs/1506.026402.基于关键点：CornerNet: https://arxiv.org/abs/1808.01244ExtremeNet: https://arxiv.org/abs/1901.080433.密集预测:FSAF...
复制链接

扫一扫