两阶段目标检测的开山奠基之作:R-CNN

首次将深度学习和卷积神经网络用于目标检测并取得显著性能提升。

  

 

图像分类、定位、目标检测、语义分割、实例分割、关键点检测(关节等等输出点的坐标)

图像分类(输入图像输出类别)目标检测(识别物体类别)语义分割(识别每个像素的类别)实例分割(在语义分割基础上识别多个物体)

表现形式:目标检测->画框 语义分割和实例分割是抠图

目标检测分为两阶段和但阶段

两阶段:预选框可能变为预测框

(红色:图像分类 绿色:目标检测)

 

(参考文献)

 

R-CNN 基本原理

输入图像->某种方法获得候选框(2k)(本文用到的是selective search)->将候选框缩放成227*227的正方形->将这些正方形逐一喂入卷积神经网络中->提取一个4096维的全连接层的特征->用线性支持向量机进行分类或者用于Bbox reg

每个步骤都需要单独优化

 

每个类别都需要训练一个svm

 

提取候选框

 

利用聚类的方法在图像中找到一些初始的大小颜色相似度一致的区域,再加权合并

缩放

 

原始范围乘卷积核

总结:

1,训练了一个高表达能力的卷积神经网络,以及这个网络提供了自底向上的候选框特征,用其进行定位和语义分割。2,在VOC的目标检测数据集上数据较少,我们现在ImageNet这个大规模辅助系统上预训练一个模型,再把它拿到指定任务上微调,这样在小数据集上也能达到很好的性能。因为我们这个方法包含了候选框提取(region proposal),所以我们把这个算法称为R-CNN: Regions with CNN features.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

xiaoni61

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值