跟R-CNN一样Fast R-CNN仍然依赖于外部候选区域的方法,如用SS选择性搜索的方法来生成候选区域。我们上面也提到,这是该算法在速度上达到瓶颈的一个重要原因。在测试中,Fast R-CNN需要2.3秒来进行预测,其中2秒用于生成2000个ROI。因此,这也跟后面的Faster R-CNN提供了改进方向。
Fasrer R-CNN仍然采用了跟Fast R-CNN相同的结构,它只是用内部深层网络(引入了区域生成网络RPN)代替了外部候选区域的方法。新的网络RPN产生ROI的效率更高,并以每幅图像10毫米的速度运行。
也就是说,Faster R-CNN,将特征提取、区域生成、目标分类和\Bounding Box回归都融合在一个网络中。
这里我们就可以将R-CNN系列中三个方法做一个简单的总结。如图。
不用强调也可以看出Faster R-CNN中的核心就是其中的区域生成网络(RPN)。
在介绍RPN之前,我们先拉通看一下Faster R-CNN的网络结构。Faster R-CNN可以简单地看做“区域生成网络(RPN)+Fast RCNN“的系统,用区域生成网络代替Fast R-CNN中的Selective Search方法,网络结构如下图。
需要注意的是,Faster R-CNN 使用的网络架构为ZF Net和VGG 16简单的说,Faster R-CNN由四个部分组成,为别为:
(1)特征提取
Faster R-CNN首先使用一组基础的conv+relu+pooling层提取候选图像的特征图。该特征图被共享用于后续RPN层和全连接层。需要注意的是,Faster R-CNN 使用的网络架构为ZF Net和VGG 16来对图像进行特征提取。
(2)RPN网络
RPN网络用于推荐候选区域,这个网络是用来代替之前的search selective的。输入为图片(因为这里RPN网络和Fast R-CNN共用同一个CNN,所以这里输入也可以认为是 featrue maps),输出为多个候选区域,这里的细节会在后面详细介绍。
(3)ROI Pooling
和Fast R-CNN一样ÿ
Faster R-CNN论文理解
最新推荐文章于 2022-11-18 17:27:56 发布