文章思路
出自:Proceedings of the AAAI Conference on Arti ficial Intelligence,2018
很可惜没有pytorch版本的代码,源码是基于c++和caffe的
文章的算法框架LSTD组合了SSD(box regression)和 Faster RCNN(box classification)。
SSD阶段,利用mutiple level特征图(区别于FPN的融合),直接在不同尺寸的特征图上进行每个grid的box regression,并用smooth L1正则项进行loss惩罚。
Faster RCNN阶段,进行一个coarse to fine的改进,首先判断每个box是否有object,初步筛选之后再进行RPN以及ROI pooling的操作,最后再用卷积层对box进行object classification。
整个训练过程分为两步,第一步在样本量充足但同源的数据集上预训练一个LSTD模型(称为source domain),然后共享除了最后一层classification的参数之外的所有参数给新的LSTD模型(target domain),在样本量较小的数据集上进行微调。
微调的时候的特别之处:loss函数加上了设计的两个正则项。 L B D \boldsymbol{L_{BD}} LBD和 L T K \boldsymbol{L_{TK}} L