matlab svm 提取目标_目标检测系列(II):RCNN、Fast RCNN、Faster RCNN、Mask RCNN

内容目录

1 R-CNN 1.1 候选框提取 1.2 特征向量提取 1.3 SVM分类 1.4 候选框修正 1.5 R-CNN的缺点 2 Fast R-CNN 2.1 RoI Pooling Layer 2.2 Multi-task loss 3 Faster R-CNN 3.1 RPN(Region Proposal Networks) 3.2 Bounding Box Regression 4 Mask R-CNN 4.1 FPN(Feature Pyramid Network) 4.2 RoI Align 4.3 Mask Branch

1 R-CNN

论文的题目是 《Rich feature hierarchies for accurate object detection and semantic segmentation》
论文地址:https://arxiv.org/abs/1311.2524
R-CNN的结构就是Selective Search + CNN + SVM,算法流程:
1) 用Selective Search提取出2000个候选框(Region Proposal)
2) 用去掉Softmax的AlexNet网络提取特征
3) 用K(目标类个数)个SVM分类器进行训练,对前面的候选框进行测试得到每个候选框属于某一类的概率值
4) 用NMS对每个类别的候选框进行处理,删掉冗余的一些候选框
5) 对剩余的候选框进行Bounding Box回归,修正候选框的位置。 af33a65115c5abc042ded7aaa97b1654.png
1.1 候选框提取
选择性搜索对输入图像进行分割产生很多小区域(2000个),根据这些小区域的相似性(颜色、纹理、大小等)采用子区域合并的方法进行区域迭代合并,生成外切矩形,也就是候选框。
1.2 特征向量提取
作者使用模型AlexNet(之前的文章介绍过这个模型,
深度学习系列(二)卷积神经网络模型(从LeNet-5到Inception V4))来提取候选框的特征向量,这里AlexNet的输入大小为227x227,而我们第一步提取的候选框大小不一,作者直接暴力的将所有候选框缩放到227x227。
网络的训练过程分为两步:
1) 基于ImageNet的图像分类训练,输出为1000维向量
2) 采用训练好的AlexNet模型在PASCAL VOC2017样本集下进行微调训练,输出为21维向量(20个目标类和1个背景)
1.3 SVM分类
对第二步提取的特征向量(AlexNet去除最后一个全连接层之后的输出,每个候选框为4096维特征),采用SVM分类器进行分类,得到类别得分。
1) 对每个类别分别训练SVM得到20个SVM模型,得到2000×20维矩阵,表示每个候选框属于某个类别的概率
2) 对2000×20维矩阵中每列进行NMS非极大值抑制,去除重叠的候选框,得到每类得分最高的一些候选框。
这里SVM训练过程的正样本为Ground Truth真实目标,负样本为与Ground Truth相交IOU小于0.3的候选框。
1.4 候选框修正
使用一个回归器对候选框进
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值