matlab svm 提取目标_目标检测系列（II）:RCNN、Fast RCNN、Faster RCNN、Mask RCNN

最新推荐文章于 2024-06-05 09:45:26 发布

weixin_39561004

最新推荐文章于 2024-06-05 09:45:26 发布

阅读量467

点赞数

文章标签： matlab svm 提取目标

本文链接：https://blog.csdn.net/weixin_39561004/article/details/112457841

版权

内容目录

1 R-CNN 1.1 候选框提取 1.2 特征向量提取 1.3 SVM分类 1.4 候选框修正 1.5 R-CNN的缺点 2 Fast R-CNN 2.1 RoI Pooling Layer 2.2 Multi-task loss 3 Faster R-CNN 3.1 RPN(Region Proposal Networks) 3.2 Bounding Box Regression 4 Mask R-CNN 4.1 FPN(Feature Pyramid Network) 4.2 RoI Align 4.3 Mask Branch

1 R-CNN

论文的题目是《Rich feature hierarchies for accurate object detection and semantic segmentation》
论文地址：https://arxiv.org/abs/1311.2524
R-CNN的结构就是Selective Search + CNN + SVM,算法流程：
1) 用Selective Search提取出2000个候选框(Region Proposal)
2) 用去掉Softmax的AlexNet网络提取特征
3) 用K(目标类个数)个SVM分类器进行训练，对前面的候选框进行测试得到每个候选框属于某一类的概率值
4) 用NMS对每个类别的候选框进行处理，删掉冗余的一些候选框
5) 对剩余的候选框进行Bounding Box回归，修正候选框的位置。

1.1 候选框提取

选择性搜索对输入图像进行分割产生很多小区域(2000个)，根据这些小区域的相似性(颜色、纹理、大小等)采用子区域合并的方法进行区域迭代合并，生成外切矩形，也就是候选框。

1.2 特征向量提取

作者使用模型AlexNet(之前的文章介绍过这个模型，
深度学习系列(二)卷积神经网络模型(从LeNet-5到Inception V4))来提取候选框的特征向量，这里AlexNet的输入大小为227x227，而我们第一步提取的候选框大小不一，作者直接暴力的将所有候选框缩放到227x227。
网络的训练过程分为两步：
1) 基于ImageNet的图像分类训练，输出为1000维向量
2) 采用训练好的AlexNet模型在PASCAL VOC2017样本集下进行微调训练，输出为21维向量(20个目标类和1个背景)

1.3 SVM分类

对第二步提取的特征向量(AlexNet去除最后一个全连接层之后的输出，每个候选框为4096维特征)，采用SVM分类器进行分类，得到类别得分。
1) 对每个类别分别训练SVM得到20个SVM模型，得到2000×20维矩阵，表示每个候选框属于某个类别的概率
2) 对2000×20维矩阵中每列进行NMS非极大值抑制，去除重叠的候选框，得到每类得分最高的一些候选框。
这里SVM训练过程的正样本为Ground Truth真实目标，负样本为与Ground Truth相交IOU小于0.3的候选框。

1.4 候选框修正

使用一个回归器对候选框进

最低0.47元/天解锁文章

weixin_39561004

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
matlab svm 提取目标_目标检测系列（II）:RCNN、Fast RCNN、Faster RCNN、Mask RCNN

内容目录1 R-CNN1.1 候选框提取1.2 特征向量提取1.3 SVM分类1.4 候选框修正1.5 R-CNN的缺点2 Fast R-CNN2.1 RoI Pooling Layer2.2 Multi-task loss3 Faster R-CNN3.1 RPN(Region Proposal Networks)3.2 Bounding Box Regression4 Mask R-...
复制链接

扫一扫