计算机视觉 -- 三代物体检测(简要总结)

R-CNN  构建网络模型

特征提取:

selective search: 小区域 合并 大区域    ;小框  合并 大框  ;

所有的框  都跑一遍 卷积神经网络   特征提取   固化  分类,回归(定位)

慢,开篇之作,低效

 

问题:时间很长,每个小框都要跑一次神经网络,加上分类器

解决:先进行卷积(共享)

 

Fast—R-CNN

先对整个图跑一遍神经网络,卷积

再把框映射过来到特征图  在进行特征提取,分类回归softmax

 

效果:比R-CNN好很多

 

 R-cnn

fast R_CNN

training time84h9.5h
speed up1x8.8x
test time per image47s0.32s
speedup1x146x

问题:还是要进行selective search

很费时间

Faster R_CNN

 

 

改进:把找框的工作也放到卷积神经网络,region proposal network (RPN)(核心改进),什么是前景(物体),什么是背景(不是物体)

如何提取:

生成很多框

可能符合标准,可能不符合,可能比较大,也可能比较小

三种比例,1:1, 2:1, 1:2       ()128:128,    128:256,    256:128)  9个anchors

基数:128,256,512 生成常规框,怎么变换才能是一个前景,物体

 

RPN层:对一个点进行特征提取,分类回归操作,判断是不是物体,以及bbox location regression 

之后   和fastR_CNN相同

 

 R-CNNFast R-CNNfaster R-CNN
test time per image (with proposals)50 second2s0.2s
speed up1x25x250x
mAP(VPC 2007)66.066.966.9
   准确率相同,但是速度高了很多
    
三代物体检测  论文最好看一看  直接看faster R-CNN
 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值