目标检测之Faster R-CNN

最新推荐文章于 2024-06-16 19:42:47 发布

thisiszdy

最新推荐文章于 2024-06-16 19:42:47 发布

阅读量204

点赞数

分类专栏：目标检测

本文链接：https://blog.csdn.net/thisiszdy/article/details/88842137

版权

23 篇文章 3 订阅

订阅专栏

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

在这里插入图片描述
Faster R-CNN分为以下四个内容：

Conv layers：作为一种CNN网络目标检测方法，Faster R-CNN首先使用一组基础的conv+relu+pooling层提取image(任意大小)的feature maps。常用一些预训练好的网络（VGG、Inception、Resnet等）；该feature maps被共享用于后续RPN层和全连接层。
Region Proposal Networks：RPN网络用于生成region proposals。该层通过softmax判断anchors属于foreground或者background，再利用bounding box regression修正anchors获得精确的proposals。
RoI Pooling。该层收集输入的feature maps和proposals，综合这些信息后提取proposal feature maps，送入后续全连接层判定目标类别。
Classifier：利用proposal feature maps计算proposal的类别，同时再次bounding box regression获得检测框最终的精确位置。

在这里插入图片描述
上图展示了Python版本中的VGG16模型中的faster_rcnn_test.pt的网络结构：

该网络对于一副任意大小PxQ的图像，首先缩放至固定大小MxN，然后将MxN图像送入网络；而Conv layers中包含了13个conv层+13个relu层+4个pooling层；
RPN网络首先经过3x3卷积，再分别生成foreground anchors与bounding box regression偏移量，然后计算出proposals；
ROI Pooling层则利用proposals从feature maps中提取proposal feature送入后续全连接和softmax网络作classification（即分类proposal到底是什么object）。

关注

专栏目录