计算机视觉 -- 三代物体检测(简要总结)

最新推荐文章于 2023-12-31 01:47:39 发布

assassin_sword

最新推荐文章于 2023-12-31 01:47:39 发布

阅读量287

点赞数

分类专栏：深度学习计算机视觉

本文链接：https://blog.csdn.net/weixin_41521681/article/details/87984471

版权

52 篇文章 5 订阅

订阅专栏

13 篇文章 0 订阅

订阅专栏

特征提取：

selective search：小区域合并大区域；小框合并大框；

所有的框都跑一遍卷积神经网络特征提取固化分类，回归（定位）

慢，开篇之作，低效

问题：时间很长，每个小框都要跑一次神经网络，加上分类器

解决：先进行卷积（共享）

先对整个图跑一遍神经网络，卷积

再把框映射过来到特征图在进行特征提取，分类回归softmax

效果：比R-CNN好很多

问题：还是要进行selective search

很费时间

改进：把找框的工作也放到卷积神经网络，region proposal network （RPN）（核心改进），什么是前景（物体），什么是背景（不是物体）

如何提取：

生成很多框

可能符合标准，可能不符合，可能比较大，也可能比较小

三种比例，1:1, 2:1, 1：2 （）128:128, 128：256, 256:128） 9个anchors

基数：128,256,512 生成常规框，怎么变换才能是一个前景，物体

RPN层：对一个点进行特征提取，分类回归操作，判断是不是物体，以及bbox location regression

之后和fastR_CNN相同

	R-CNN	Fast R-CNN	faster R-CNN
test time per image (with proposals)	50 second	2s	0.2s
speed up	1x	25x	250x
mAP(VPC 2007)	66.0	66.9	66.9
			准确率相同，但是速度高了很多

三代物体检测论文最好看一看直接看faster R-CNN

关注

专栏目录