论文链接:https://arxiv.org/abs/1803.01529
有问题的地方请指出~
摘要
近期,基于大规模数据集,目标检测由了飞速的发展。但是完整标记的数据集并非易得,因此,文章提出了一种新的方法:low-shot transfer detector (LSTD),能够利用源域中充足的知识来构建只有少量训练样本的目标域上的有效检测器。文中的主要贡献有:
1. 提出了灵活的LSTD深度架构,该框架整合了SSD和Faster RCNN的优点,将它们统一到一个深度框架中,该框架能够缓解小样本带来的迁移问题。
2. 引入全新的小样本检测正则化迁移学习框架,使用了迁移知识(transfer knowledge, TK)和背景抑制(background depression, BD)作为正则项,使得充分得利用源域和目标域中的知识。
引入
过去的几年里,许多基于深度学习的目标检测方法取得了瞩目的成就,但是这些方法很大程度上依赖于完整标记的大规模的数据,然而在实际实践中,完整标记的数据集是很有限的。(这里值得注意的是,在目标检测问题中,完整标记是指既有类别标签,又有对应类别的物体所在位置的边界框标签)。
对于这一问题,一个普遍的方法是收集额外的容易标注的数据集,但是训练图像缺乏充分的监督,该方法的效果依然较受限制。另一个方法是进行迁移学习。鉴于迁移学习在图像分类问题上的成功范例,考虑将它应用到目标检测问题中,对比与增加简单标注的解决方法,迁移学习不需要额外的数据集,这一点的占优的。更重要的是,源域中的知识将是生成目标域的检测器过程中的有效监督。虽然想法很好,但是基于小样本目标检测的迁移学习依旧是很困难的,原因如下:
1. 将普遍的迁移学习方法应用到目标检测中是不合适的。这是因为在很小目标数据集上进行微调,很难消除检测问题和分类问题之间的不同点。
2. 事实证明,相比于分类问题,在目标检测问题上进行迁移学习,会更容易发生过拟合。这可能是因为目标检测需要学习的知识更多(位置信息和类别信息)。