相比较之前的faster-rcnn而言,rfcn比之运行速度更快,效率更高,在准确率上也没有下降。那么rfcn网络到底是什么样的网络呢?其比faster-rcnn的区别在哪里呢?
一、rfcn的基本结构:
1.一个基本的conv网络:ResNet101--------------->提取基本的特征
2.一个RPN网络(Faster Rcnn来的)
3.一个position sensitive的prediction层
4.ROIpooling+投票的决策层
---RFCN的idea出发点:
分类需要特征具有平移不变性,检测则要求对目标的平移作出准确的响应。Faster-rcnn类的方法在ROIpooling前都是卷积的,是具备平移不变性的,但一旦插入ROIpooling之后,后面的网络结构就不再具备平移不变性了。因此,我们需要position sensitive core map来把目标的位置信息融入到ROIpooling中。
---希望:
将耗时的卷积层都尽量移到前面共享的subnetwork上,也就是产生共享的feature map的网络。
---具体的改进:
Faster-rcnn中用的Resnet(前91层共享,插入ROIpooling,后面10层不共享)。
RFCN把所有的101层都改在了前面共享的subnetwork上,最后的predictio