RetinaNet论文

最新推荐文章于 2022-11-09 19:44:02 发布

zjjszj

最新推荐文章于 2022-11-09 19:44:02 发布

阅读量456

点赞数

分类专栏：论文阅读文章标签：神经网络深度学习人工智能计算机视觉

本文链接：https://blog.csdn.net/ZJpingfanzhilu/article/details/105311892

版权

论文阅读专栏收录该内容

10 篇文章 0 订阅

订阅专栏

1、引入

摘要：本文是2017年何凯明 ICCV最佳学生论文奖。论文认为单阶段目标检测低于两阶段的原因是正负样本不均衡，导致模型在训练时偏向负样本，且过多的简单负样本使模型退化。为了降低影响，提出focal loss损失函以及检测网络结构，提升了性能。
优点：无论是精度还是速度都是全面超越。
创新点：

提出focal loss损失函苏。
提出目标检测网络结构。
可以用于多标签分类（损失函数使用的是binary_cross_entropy_with_logits）。

2、网络结构

如图2-1所示。

使用多尺度特征金字塔网络。
分类与回归使用两个子网络，网络结构相同但不共享参数。

图2-1 网络结构

3、损失函数

改编交叉熵损失函数。
$FL(p_t)=-\alpha _t(1-p_t)^\gamma log(p_t)$

$\alpha_t$ 是系数，有利于提高精度。
损失函数使用的是binary_cross_entropy_with_logits，用于多标签分类。

4、参数设置

损失函数： $\alpha\in [0.25,0.27],$ 本文设置 $\alpha =0.25,\gamma=2$ 。
anchor scales $\times$ aspects=6/9
重要
因此正负样本不平衡，为了使模型训练前期保持稳定。将除了分类子网络最后一层，其余层w设为u=0, $\sigma =0.01$ 的高斯分布，b=0。最后一层为了使每一个anchor为前景的概率都为 $\pi$ 。因此w设为u=0, $\sigma =0.01$ 的高斯分布，b设为 $-log((1-\pi)/\pi)$ 。b的推导：输出概率使用逻辑回归函数即 $\cfrac 1 {1+e^{-x}}$ 。本文中将 $\pi$ 设为0.01，思想是增加正样本的损失值。

zjjszj

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
RetinaNet论文

1、引入摘要：本文是2017年何凯明 ICCV最佳学生论文奖。论文认为单阶段目标检测低于两阶段的原因是正负样本不均衡，为了降低影响，提出focal loss损失函以及检测网络结构，提升了性能。优点：无论是精度还是速度都是全面超越。创新点：提出focal loss损失函苏。提出目标检测网络结构。可以用于多标签分类（损失函数使用的是binary_cross_entropy_with_lo...
复制链接

扫一扫

专栏目录