cnn 示意图_Faster R-CNN学习笔记

Faster R-CNN在Fast R-CNN基础上改进,通过RPN(Region Proposal Network)高效生成候选区域。本文详细阐述RPN的anchors生成、预测原理、NMS处理及损失函数计算,解析Faster R-CNN在目标检测中的作用。
摘要由CSDN通过智能技术生成

1、 前言

框架最大的特点:Faster R-CNN框架是在Fast R-CNN框架的基础上作进一步改进,其最大的改进是生成候选区域的方法。以往的Fast R-CNN框架和R-CNN框架使用selective search(ss)方法生成1K~2K个候选区域,而Faster R-CNN框架使用RPN结构生成候选区域,大大减少了框架生成候选区域所耗费的时间。因此本文重点讲解RPN结构原理。需要了解Fast R-CNN框架原理的可以参照下列文章。

KMUST人工智能实验室:Fast R-CNN阅读笔记​zhuanlan.zhihu.com

2、 Faster R-CNN框架基本的预测目标流程

(1)将图像输入卷积网络提取各种特征,得到相应的特征图。

(2) 将特征图输入RPN结构生成候选区域,将RPN生成的候选区域投影到特征图上,获得相应的特征矩阵。

(3) 将每个特征矩阵通过ROI pooling层缩放到7*7大小的特征图,接着将该特征图通过一系列的全连接层得到预测结果。

c8352b25e23e6cdbfddaec18c1656191.png
图1 Faster R-CNN框架图

3、 RPN结构原理

f58db7348af23237528d2aa69e4da805.png
图2 RPN结构图

3.1 生成anchors的原理

将特征图输入到RPN结构后,第一步是对特征图进行卷积操作(3*3的卷积核,stride=1,padding=1),其中特征图与滑动窗口(卷积核)的中心点(又因为padding=1,这个中心点其实就是特征图的每一个像素)映射回到原图的位置,然后以在原图位置为中心点生成K个anchors,那么anchors的面积以及宽高比例是多少呢?通常anchors有三种面积(

,
, <
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值