1.Introduction
在之前介绍的R-CNN中,训练是分多阶段进行的(multi-stage pipeline),基本上都要分为4步extracting features、fine-tuning a network with log loss、training SVMs和fitting bounding box regressors。新提出的SPPnet网络也和这个过程类似,故导致训练比较缓慢。本文中,提出了一个新的单阶段训练算法,它可以同时学习去分类物体建议框和改善他们的空间位置,对应于原文中就是:We propose a single-stage training algorithm that jointly learns to classify object proposals and refine their spatial locations
2.Fast R-CNN的结构和训练
Fast R-CNN的整体结构如下所示:
首先,输入的是一张完整图片和一组物体建议框(也叫RoIs)