RCNN,fast-RCNN,faster-RCNN,Mask R-CNN

目录

一:回顾                

二:RCNN

RCNN算法流程4步:

RCNN存在的问题:

 三:Fast-RCNN:

四:Faster R-CNN:

 Faster-RCNN(RPN+Faster R-CNN)的不同点:

五:Mask R-CNN

六:总结

所有项目代码+UI界面


一:回顾                

       上一篇我们了解了单发多框检测(SSD),是一种用于目标检测的深度学习模型。"单发"指的是指单个神经网络在一次前向计算中同时预测多个目标的位置和类别,而"多框"指的是对于每个预测目标位置,它的主要思想是在整个图像上应用多个卷积层来预测不同尺度和长宽比的边界框,并通过非极大值抑制来获得最终的检测结果。SSD的优点是可以在较少的计算量下实现实时目标检测,并且可以检测不同尺度和长宽比的物体。

二:RCNN

        R-CNN首先从输入图像中选取若干(例如2000个)提议区域(如锚框也是一种选取方法),并标注它们的类别和边界框(如偏移量)。 (Girshick et al., 2014)然后,用卷积神经网络对每个提议区域进行前向传播以抽取其特征。 接下来,我们用每个提议区域的特征来预测类别和边界框。

276375ac341e41cfb54c6ffd36daa98b.png3d298659d3024448a3608b428b50d02b.png9d65cf4c19534252b5a8c033e99e277f.png

RCNN算法流程4步:

10232a7c0a904120b00d7b1029f3d36e.png

 7a36d01cfb0c457f9b205850ad1c0514.png

对偏移量做损失d5c1b17805014a54b78d1fef5143db02.png

RCNN存在的问题:

        用ss算法生成一系列候选框,通过回归器调整偏移量。训练器和回归器相互独立导致训练速度很慢的原因之一

0a982646d2154b38831a9940fd06eabd.png

 三:Fast-RCNN:

        R-CNN的主要性能瓶颈在于,对每个提议区域,卷积神经网络的前向传播是独立的,而没有共享计算。 由于这些区域通常有重叠,独立的特征抽取会导致重复的计算。 Fast R-CNN (Girshick, 2015)对R-CNN的主要改进之一,是仅在整张图象上执行卷积神经网络的前向传播。

104a0578d3cd4b9fa518291f6e9bdf84.png

1ac4b6a1b7ff4be1ba7964f13c0fd0a7.png

        Fast-RCNN(相比与R-CNN快了200多倍 ,但是在cpu上预测还是很慢),再下一步faster-RCNN就想办法把SS算法融入到网络中,就形成了端对端的训练过程。

四:Faster R-CNN:

        为了较精确地检测目标结果,Fast R-CNN模型通常需要在选择性搜索中生成大量的提议区域。 Faster R-CNN (Ren et al., 2015)提出将选择性搜索替换为区域提议网络(region proposal network),从而减少提议区域的生成数量,并保证目标检测的精度。

22208739ad51432dafe09a73ab906758.png

 7b5853a8418a4b568f2e9b4c19f125da.pngfa266527326b47f3a518fe3784396354.png

 f1d3150510b74d66b4597afb7c3e7ff5.png

 Faster-RCNN(RPN+Faster R-CNN)的不同点:

      用RPN网络代替了SS算法生成预选框

52ba7f73afcf4670ab4defb452188b96.png

五:Mask R-CNN

        如果在训练集中还标注了每个目标在图像上的像素级位置,那么Mask R-CNN (He et al., 2017)能够有效地利用这些详尽的标注信息进一步提升目标检测的精度。

2d3f9f06d240439eb96931ab6a89b623.png

         Mask R-CNN是基于Faster R-CNN修改而来的。 具体来说,Mask R-CNN将兴趣区域汇聚层替换为了 兴趣区域对齐,使用双线性插值(bilinear interpolation)来保留特征图上的空间信息,从而更适于像素级预测。 兴趣区域对齐层的输出包含了所有与兴趣区域的形状相同的特征图。 它们不仅被用于预测每个兴趣区域的类别和边界框,还通过额外的全卷积网络预测目标的像素级位置。

六:总结

        R-CNN是单独ss算法提取预选框,然后CNN做特征提取,然后svm做分类,然后偏移量做回归。Fast R-CNN是单独拿出来一个SS算法来生成预选框,而其他三个部分是在CNN网络中。而Faster R-CNN是RPN代替SS算法来提取预选框。4个部分却别融合在CNN网络中,是个整体。

所有项目代码+UI界面

视频,笔记和代码,以及注释都已经上传网盘,放在主页置顶文章

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值