faster-rcnn学习笔记

最新推荐文章于 2022-11-01 11:56:01 发布

新火之光

最新推荐文章于 2022-11-01 11:56:01 发布

阅读量194

点赞数

分类专栏：蓝桥文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45878378/article/details/107741074

版权

faster-rcnn学习笔记

重要概念
原理学习笔记
- fast -rcnn
- rpn

代码源码：https://github.com/chenyuntc/simple-faster-rcnn-pytorch

重要概念

ROI (Region Of Interest) : 从目标图像中识别出的候选识别区域。

ROI pooling :一个简化的spp池化，将原始图像的ROI变为固定的特征。

RPN（Region Proposal Network）：区域生成网络。它的作用是根据原图片卷积产生的feature map得到一系列的proposal（候选框）。

anchor boxes : 给定大小的框，在原图上生成。每一个确定的中心点会产生9个anchor
(3面积*3比例)。 anchor 会经过变换调整成proposal（候选框）。

Bounding-Box regression :将给定的框调整到 Ground Truth上。

Ground Truth ：经过标注的框。

iou：交并比
在这里插入图片描述

原理学习笔记

整个算法流程可分为三个部分：
1 将图像输入网络得到相应的特征图。
2 使用RPN生成候选框，将候选框投影到特征图上得到特征矩阵。
3 将特征矩阵通过ROI pooling层缩放到7*7，接着将特征图全连接得到预测结果。

整个网络可以理解为RPN 与 Fast R-CNN的结合。RPN主要替代Fast R-CNN的边界框的生成。

在这里插入图片描述

fast -rcnn

算法流程分为三个部分：
1 使用ss算法生成候选区域
2 图像输入网络得到特征图，将Selective Search算法生成的候选框投影到特征图上获得相应的特征矩阵。
3 特征矩阵通过ROI pooling 缩放到 7*7的特征图，接着将特征图展平通过一系列全连接层得到预测结果。

相比较RCNN,Fast-RCNN将整张图送入网络，候选区域的重复特征不需要计算。

刚开始算法生成的初始框大概有2000多个，但只取大概64个用来训练，且分为正样本（有目标），负样本（没有目标），用来训练。

任意尺寸的候选区域经过ROI Pooling Layer变为统一尺寸。
在这里插入图片描述
经过ROI Pooling 之后的特征矩阵经过全连接后并联两个部分。sofamax（分类器）和 bbox_pred(边界框回归器)。

分类器的输出结果为 N+1 个类别的概率（N个检测目标+背景）共 N+1个节点。

边界框回归器输出N+1个类别的候选边界框回归参数（ $d_{x},d_{y},d_{w},d_{h}$

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
faster-rcnn学习笔记

py-faster-rcnn源码学习笔记重要概念caffe-fast-rcnn代码源码：https://github.com/rbgirshick/py-faster-rcnn重要概念ROI (Region Of Interest) : 从目标图像中识别出的候选识别区域。ROI pooling :一个简化的spp池化，将原始图像的ROI变为固定的特征。RPN（Region Proposal Network）：区域生成网络。它的作用是根据原图片卷积产生的feature map得到一系列的p
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。