RCNN算法流程

BBQ呀

已于 2022-10-22 19:15:57 修改

阅读量855

点赞数

文章标签：深度学习计算机视觉人工智能

于 2022-10-20 09:20:03 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_49534117/article/details/127419451

版权

介绍：2014年提出，之前目标检测为手工提取特征，为深度学习提取目标特征的开山之作。

一、总体流程可分为四个步骤

二、各个步骤

1.候选区域的生成

2.对于每个候选区域，使用深度网络提取特征

CNN其实就是图像分类网络，只不过是在图像分类中在CNN提取特征展平处理之后，要经过一个全连接层（输出通道数为类别个数）和softmax层，这里把这部分去掉了，从而每个框框留下了4096维的特征向量，总共为【2000，4096】。

3.特征送入每一类的分类器，判定类别

a、SVM是一个二分类器，这里以VOC数据集为例，有20个类别，所以需要20个SVM分类器【4096，20】，每个分类器会输出是该类别的得分。

b、对于SVM输出矩阵【2000，20】，对于每一列，代表这两千个候选框中属于该类别的分数，对于该列，通过非极大值抑制的方式剔除重叠建议框，如此循环，直到把该类别的2000个候选框遍历完。

4.使用回归器精细修正候选框位置

其实这里可以分为两步。第一步是上一步筛选出来的20个类别的建议框之后（从【2000，20】个建议框中筛选得到的），会对这些建议框进一步筛选，每个类别的建议框（【2000，1】筛选得到的）中会与标注该类别的真实grounf_truth计算IOU，筛选出大于阈值的候选框。

第二步是对于上一步【2000，20】个候选框中筛选出来的，找到该候选框对应当的第二步提取得到的4096维的向量（从【2000，4096】中筛选），用20个回归器分别对20个类别中剩余的建议框回归操作（分类器输出为【目标建议框中心X偏移量，Y偏移量，边界框高度缩放因子，宽度缩放因子】），通过得到的输出对于边界框进行调整。

三、总结

FasterRCNN

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
RCNN算法流程

CNN其实就是图像分类网络，只不过是在图像分类中在CNN提取特征展平处理之后，要经过一个全连接层（输出通道数为类别个数）和softmax层，这里把这部分去掉了，从而每个框框留下了4096维的特征向量，总共为【2000，4096】。a、SVM是一个二分类器，这里以VOC数据集为例，有20个类别，所以需要20个SVM分类器【4096，20】，每个分类器会输出是该类别的得分。 b、对于SVM输出矩阵【2000，20】，对于每一列，代表这两千个候选框中属于该类别的分数，对于该列，通过非极大值抑制的方式剔除重叠建议
复制链接

扫一扫

博客等级

码龄4年

24
原创

69
点赞

132
收藏

59
粉丝

关注

私信

热门文章

最新评论

Fater RCNN 试着加入注意力机制模型
m0_69546110: 大哥，能给个课程链接吗？b站没找到
YOLO剪枝模型部署到边缘终端设备jeston-orin-nano方法
CSDN-Ada助手: 恭喜你写了第20篇博客！看到你分享关于将YOLO剪枝模型部署到边缘终端设备jeston-orin-nano的方法，我感到非常兴奋。你的经验分享对于我们这些刚刚接触这一领域的人来说，是非常有价值的。希望你能继续分享更多关于边缘计算和深度学习模型部署的经验，也许可以考虑分享一些在实际应用中遇到的挑战和解决方案，这对于我们理解这一领域的复杂性会有所帮助。期待你的下一篇博客！
给实验室师弟的第一次分享-深度学习基础如何学习
每天都在深度学习: 感谢师哥花费时间为我们总结经验！！！
Fater RCNN 试着加入注意力机制模型
qq_64785929: 有没有resnet50-fpn加注意力机制的权重
Fater RCNN 试着加入注意力机制模型
qq_42054954: 您好，现在它的名字改了吗？能给个链接吗？谢谢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。