Faset RCNN （学习笔记一）

四邻域

已于 2022-08-22 22:02:49 修改

阅读量796

点赞数

文章标签：深度学习目标检测计算机视觉

于 2022-08-22 21:32:45 首次发布

本文链接：https://blog.csdn.net/weixin_39542613/article/details/126464843

版权

本文是Faster R-CNN的学习笔记，介绍了模型的工作流程，包括特征提取、区域候选网络RPN、RoI Pooling，以及训练过程中的分类和位置回归损失。详细解释了从预训练权重初始化到训练RPN和Faster R-CNN网络的步骤。

摘要由CSDN通过智能技术生成

Faset RCNN （学习笔记一）

学习一个模型一定一定要从两方面入手：
测试（Test）
首先理清测试逻辑，即模型已经训练好了，扔进去一张图片，是如何一步步生成带有检测框和置信度的检测结果的。
训练（Train）
然后再看训练过程，检测和训练过程通常架构都是一样的，训练主要是加入了LOSS来学习各个地方的参数，所以这步主要就是搞清LOSS是如何运作的。
在这里插入图片描述
1.conv layers 特征提取网络得到feature maps 用于后面的RPN层和取proposal
2.RPN 区域候选网络用于生成候选框。两个部分，一个是anchor bool值二分类用来检测anchor种是否有目标，还有一个 bounding box regression 用来修正使得得到较为准确的检测框。
3.Rol Pooling