LSTD: A Low-Shot Transfer Detector for Object Detection论文理解

本文链接：https://blog.csdn.net/qq_41064487/article/details/124500128

文章目录

- 文章思路
- 可以利用的点

文章思路

出自：Proceedings of the AAAI Conference on Arti ficial Intelligence，2018
很可惜没有pytorch版本的代码，源码是基于c++和caffe的

文章的算法框架LSTD组合了SSD（box regression）和 Faster RCNN（box classification）。

SSD阶段，利用mutiple level特征图（区别于FPN的融合），直接在不同尺寸的特征图上进行每个grid的box regression，并用smooth L1正则项进行loss惩罚。

Faster RCNN阶段，进行一个coarse to fine的改进，首先判断每个box是否有object，初步筛选之后再进行RPN以及ROI pooling的操作，最后再用卷积层对box进行object classification。

整个训练过程分为两步，第一步在样本量充足但同源的数据集上预训练一个LSTD模型（称为source domain），然后共享除了最后一层classification的参数之外的所有参数给新的LSTD模型（target domain），在样本量较小的数据集上进行微调。

微调的时候的特别之处：loss函数加上了设计的两个正则项。 $\boldsymbol{L_{BD}}$ 和 $\boldsymbol{L_{TK}}$