目标检测基础-RCNN系列模型

最新推荐文章于 2024-09-10 11:28:30 发布

knight11112

最新推荐文章于 2024-09-10 11:28:30 发布

阅读量527

点赞数

文章标签：动态规划算法安全

原文链接：www.sobd.cc

版权

目标检测基础-RCNN系列模型

简介开头先感谢可爱的小姐姐的细心讲解，视频网址如下：目标检测基础——RCNN系列模型（理论和代码复现）_哔哩哔哩_bilibili目录：目录RCNN过程非极大值抑制（NMS）Bounding-box regressionRCNN对语义分割的尝试：语义分割的简史：SPPnet简介Fast-RCNNFast-RCNN 训练过程Fast-RCNN的优缺点：Faster-RCNN目标候选框得实现：区域提案方法 Extract region propo...

开头先感谢可爱的小姐姐的细心讲解，视频网址如下：

目标检测基础——RCNN系列模型（理论和代码复现）_哔哩哔哩_bilibili

RCNN过程

非极大值抑制（NMS）

Bounding-box regression

Faster 训练过程由两个部分循环操作组成的：

目标候选框得实现：

区域提案方法 Extract region proposals：

使用选择搜索 selective search 提取2000个候选区域

经过得到得（x‘，y’，w‘，h’）与现实标注（x，y，w，h）以欧氏距离损失做回归

对候选框 bounding box 进行评分和整合。

性

选取备用的候选框工作的方法有很多种，下面来介绍一下 selective search 和 EdgeBoxes 。

视频的小姐姐说聚合到 2000张候选框就停下来了，实际操作待检验。还有必要提的一点是这种selective search 是一种类似于聚类的方法，也就是是需要在CPU上进行的。

边缘框的方法是根据图像里面色差比较大的物体的边缘来确定框的位置的，实际效果来说速度很快，准确度也还可以。

RCNN过程

非极大值抑制（NMS）

Bounding-box regression

对候选框经过了中间过程（权重学习）后得到的微调参数，最后作用与候选框让它能变成与实际标注框差不多相近的效果。

RCNN对语义分割的尝试：

RCNN的优缺点：

这里我们可以先讨论一下语义分割是什么：

图像分割是物体检测后的另一个任务，我们要对图像在像素级别上对前景和后景的划分。然后在前景的基础上对图像进行一个分类。

语义分割的简史：

一般以2015年为分界点：

FCN 就是将图片不断卷积池化，卷积池化。随着层数的增加，语义程度越来越高。一直卷积到（类别+1，理解为检测物品类别+背景）的通道数作为输出到一个和原图一样的（大小，长宽，通道数）特征图上。在这个特征图上包含了前面的语义类别，一类的物体往往只有一种颜色。-------这相当于用深度学习去做了一个语义分割

有意思的是，我们可以发现语义比较高，卷积的图比较小的时候，整个特征图就糊成一块了。在比较靠前，较接近原图的卷积层取出来的图就显得精细一些。（比较ground truth 和第五层）

所以在后面他把后面的语义较高的层和前面语义较低的层做了一个结合，我理解是使得原始图像信息得到了保存。