目标检测之R-CNN

一、目标检测之R-CNN

Rich feature hierarchies for accurate object detection and semantic segmentation(用于精确物体定位和语义分割的丰富特征层次结构)
论文链接:http://arxiv.org/abs/1311.2524
论文翻译:https://blog.csdn.net/xiaqunfeng123/article/details/78715983
论文详解:https://blog.csdn.net/u014696921/article/details/52824097

二、R-CNN算法

在这里插入图片描述
1、候选区域选择(region proposal):用来给输入的图像生成大约2000个类别无关的候选区域;R-CNN采用的区域选择方法是选择性搜索(selective search)。

2、特征提取:用来从每个候选区域中提取固定长度为4096的特征向量。R-CNN利用卷积网络(比如AlexNet)来计算每个候选区域的特征,要求先把推荐转变为卷积网络的输入大小(比如227×227的RGB图像),并做减均值处理。

3、区域分类:1)用来对每个候选区域进行打分和筛选;R-CNN采用支持向量机(SVM)对所提取的特征向量打分,在根据分值高低,通过贪婪非最大抑制(NMS)进行筛选,保留高分推荐,拒绝低分推荐,拒绝条件是与某高分推荐的交并比(IOU)大于一个通过学习得到的阈值。2)通过边界回归(bounding-box regression) 得到精确的目标区域,由于实际目标会产生多个子区域,旨在对完成分类的前景目标进行精确的定位与合并,避免多个检出。

R-CNN存在的问题:

1)多个候选区域对应的图像需要预先提取,占用较大的磁盘空间;

2)针对传统CNN需要固定尺寸的输入图像,crop/warp(归一化)产生物体截断或拉伸,会导致输入CNN的信息丢失;

3)每一个ProposalRegion都需要进入CNN网络计算,上千个Region存在大量的范围重叠,重复的特征提取带来巨大的计算浪费。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值