目标检测学习-TridentNet

1.研究背景

1.1 图像金字塔

图像金字塔如下图Fig1所示是一种以多分辨率来解释图像的结构,通过对原始的图像进行不同尺度的像素采样的方法,生成多个不同分辨率的图像。将生成的图像按照分辨率的大小从大到小进行排列,这就构成了一个图像金字塔,图像金字塔可以用在解决目标检测在处理多尺度变化问题。

1.2 特征金字塔 

在绝大多数目标检测网络中,如下图Fig2特征金字塔(Feature Pyramid Network,FPN)是一个不可缺少的部分,FPN网络主要解决的问题是目标检测在处理多尺度变化问题的不足。FPN主要有以下两个作用:1)多尺度特征融合,提高了特征的丰富程度;2)使用分治法,将目标检测任务按照目标尺寸不同,分成若干个检测子任务。

2.存在的问题

在目标检测中兼顾大尺寸目标和小尺寸目标是一个难点,图像金字塔与特征金字塔可以解决多尺度变化的问题,但还是存在一下问题:

1)图像金字塔通过缩放输入图像实现不同尺寸的目标检测,虽然效果很好,但是速度很慢。

2)FPN虽然在速度上会比图像金字塔要快一些,但是还是存在一些问题,第一是由于不同尺寸的目标会被分配到不同的特征层上可能会导致过拟合;第二是在特征金字塔中,小尺度目标使用低层特征,大尺度目标使用高层特征,对于低层特征来自网络的浅层,而高层特征来自网络的深层,这就使得高层网络的能力更强,对于低层网络在检测上存在不公平。

3.TridentNet

3.1 网络结构

针对以上的问题,文章提出了TridentNet,网络结构如下图Fig3所示,网络中包含3个使用膨胀卷积的特征图分支,它们的网络结构相同只有膨胀卷积的膨胀率不同,膨胀率为1,2,3。网络中使用这三个分支来检测不同尺寸的物体,并且每个检测分支的深度相同这对于检测不同尺寸的物体就保持了公平性。

3.2 网络细节

TridentNet网络中的具体结构如下图Fig4所示,TridentNet网络中包含了三个带有膨胀卷积的残差块,在训练的过程中,网络会对每一个分支都进行优化。因此,需要对图片中的ground truth进行一个分配,公式为:\l_{i}\leq\sqrt{wh}\leq{u_{i}},其中w,h为ground truth的宽,高。l_{i},u_{i}为人工定义的参数。由于网络中三个分支的结构相同只是膨胀卷积的膨胀率不同,文中提出可以实现三个分支的参数共享,这样对于不同尺寸的目标包含的信息都会保存在一套参数中。如此,网络可以近似成为一个只有主要分支的网络。

网络在预测的时候,由于网络中有三个分支,所以每个分支都会产生检测结果,对于每个分支使用NMS或者soft-NMS处理掉在该分支之外的bbox,如果对每个分支都进行检测那这样预测的速度是很慢的。为此,文中提出了Fast Inference Approximation,在预测的时候只是用中间的那个分支,因为中间的分支有效的覆盖了大目标和小目标。这样做与原始的三分支预测相比性能只有很小的下降。这也就是使用了参数共享的一个有点。

4.实验

1)下图Fig5为TridentNet模块分支数的实验

2)下图Fig6为TridentNet各分支检测结果的评估

3)下图Fig7为TridentNet中间分支在coco测试的结果

4)下图Fig8为TridentNet与其他网络在coco数据集上的比较

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
目标检测算法的发展经历了几个重要的阶段。以下是一个简要的综述: 1. 基于传统机器学习方法的目标检测算法: 在深度学习兴起之前,研究人员主要使用传统的机器学习方法来解决目标检测问题。其中最经典的方法包括基于滑动窗口的方法和基于图像分割的方法。这些方法通常需要手工设计特征提取器,并且在处理复杂场景时表现有限。 2. 基于深度学习目标检测算法: 随着深度学习的快速发展,基于深度卷积神经网络(CNN)的目标检测算法取得了巨大的突破。其中最具代表性的算法是R-CNN系列(包括R-CNN、Fast R-CNN、Faster R-CNN)和YOLO系列(包括YOLO、YOLOv2、YOLOv3)。这些算法通过端到端的训练方式,可以直接从图像中检测出目标,并且在准确性和速度上都取得了显著的提升。 3. 单阶段和两阶段目标检测算法: 基于深度学习目标检测算法可以分为单阶段和两阶段两种类型。两阶段方法主要包括R-CNN系列和其改进版本,它们通常先生成候选框,然后再对候选框进行分类和调整。而单阶段方法主要包括YOLO系列和SSD(Single Shot MultiBox Detector),它们直接在特征图上进行目标检测,速度更快但准确性稍低。 4. 目标检测算法的进一步发展: 随着目标检测任务的需求不断增加,研究人员提出了许多改进算法来提升性能。例如,基于注意力机制的方法(如Mask R-CNN)可以更好地处理遮挡目标;基于注意力机制和跨尺度特征融合的方法(如TridentNet)可以提升小目标的检测性能;基于自监督学习的方法(如MoCo)可以提升模型的表示学习能力。 总体来说,目标检测算法经历了从传统机器学习到深度学习的转变,并取得了显著的进展。未来,随着技术的不断发展,我们可以期待更加准确和高效的目标检测算法的出现。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

金牌港C

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值