DSOD:从零开始学习深度监督的对象检测器
背景
以前的目标检测算法基本都是先在 ImageNet(分类) 数据库上进行预训练,然后再微调。这个微调也叫做迁移学习 transfer learning。在 pretrained models 上微调有两个好处:
1)有很多好的模型是开源的,可以直接将他们用于目标检测;
2)微调可以快速获得最终的模型,需要的训练数据也相对较少。
但是微调在目标检测问题上也有缺点:
1.Limited structure design space(结构设计的局限性), 基于 ImageNet 分类数据库的预训练模型非常大,参数太多。直接将它们用于目标检测,导致模型结构灵活性差,且难以改变网络结构,计算量也大,限制其应用场合。
2.Learning bias (学习的偏差),以前的目标检测算法基于ImageNet(分类) 数据库进行与训练,而分类任务和检测任务的损失函数和类别分布是不一样的,两者的搜索/优化空间也是不一样的,所以在分类上预训练可能会导致在检测上的得到局部最优,而不是全局最优解。
3.Domain mismatch(域不匹配),尽管微调可以减少不同目标类别分布的差异性,但是对于一些目标域如深度图、医学图像等和 ImageNet(源域) 的差异性太大, 微调效果不理想。
基于以上问题,作者认为根本的解决方法从头开始训练目标检测器( train from scratch )。因此构建了这么一个网络称之为DSO