目标检测入门系列手册二：RCNN训练教程

最新推荐文章于 2022-02-21 14:06:21 发布

kongpingyuansu

最新推荐文章于 2022-02-21 14:06:21 发布

阅读量632

点赞数

分类专栏：机器学习人工智能文章标签：视觉计算机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kongpingyuansu/article/details/103385347

版权

在这里插入图片描述
目标检测需要获取图片中所有目标的位置及其类别，对于图2-1 中的 3 张图而言，当图片中只有一个目标时，“regression head”预测 4 个值，当图片中有 3 个目标时，“regression head”预测 12 个值，那么当图片中有多个目标时，“regression head”要预测多少个值呢？
在这里插入图片描述
这时根据读者已经学过的一些知识，可能会尝试用滑窗的方法来解决，如图2-2所示。但是，这里有一个问题，我们需要设计大量的不同尺度和长宽比的“滑窗”使它们通过CNN，然而这个计算量是非常巨大的。有没有什么方法能使得我们快速定位到目标的潜在区域，从而减少大量不必要的计算呢？
在这里插入图片描述

学者们在这个方向做了很多研究，比较有名的是selective search 方法，具体方法这里不做详细说明，感兴趣的读者可以看关于selective search 的论文。大家只要知道这是一种从图片中选出潜在物体候选框（Regions of Interest，ROI）的方法即可。有了获取ROI 的方法，接下来就可以通过分类和合并的方法来获取最终的目标检测结果。基于这个思路有了下面的R-CNN 方法。

R-CNN

下面介绍R-CNN[1] 的训练过程，整体训练流程如图2-3 所示：
图2-3　R-CNN 训练过程下面是所有检测问题都会用到的一块代码：IOU 的计算。

def bboxIOU (bboxA, bboxB):

A_xmin = bboxA[0]
A_ymin = bboxA[1]
A_xma

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
目标检测入门系列手册二：RCNN训练教程

目标检测需要获取图片中所有目标的位置及其类别，对于图2-1 中的 3 张图而言，当图片中只有一个目标时，“regression head”预测 4 个值，当图片中有 3 个目标时，“regression head”预测 12 个值，那么当图片中有多个目标时，“regression head”要预测多少个值呢？这时根据读者已经学过的一些知识，可能会尝试用滑窗的方法来解决，如图2-2所示。但是，...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。