R-CNN

16 篇文章 0 订阅
14 篇文章 0 订阅

  • 候选区域方法:提供了一个物体检测的一种重要思路

R-CNN步骤:

  • 1.对于一张图片,找出默认2000个候选区域
  • 2.2000个候选区域做大小变换,输入AlexNet当中,得到特征向量
    • 2000 * 4096
  • 3.经过20个类别的SVM分类器,对于2000个候选区域做判断,得到(2000, 20)得分矩阵
  • 4.2000个候选区域做NMS,取出不好的,重叠高度的一些候选区域,得到剩下分数高的,从而得到好的框
  • 5.修正候选框,做一个bbox的回归微调

算法输出A,B,框位置是选择性搜索后得出的

最终结果:理想状态,每一个Ground truch都有一个候选框预测

  • 为了让修选框标注更加准确,去修正原来的位置
  • A是候选框,G是目标GT框
  • 让A与G做回归训练,得到四个参数

RCNN输出:一张图片预测一个x候选框,x * w = y_locate

    • y_locate是真正算法输出的位置

改进SSPNet

R-CNN(Region-based Convolutional Neural Networks)是一种目标检测算法,它通过两个阶段来检测图像中的目标物体。首先,R-CNN使用选择性搜索(Selective Search)算法生成一系列候选区域,然后对每个候选区域进行卷积神经网络(CNN)特征提取和分类。R-CNN的主要缺点是速度较慢,因为每个候选区域都需要独立地进行CNN特征提取和分类。 Fast R-CNN是对R-CNN的改进,它通过引入RoI池化层(Region of Interest pooling)来解决R-CNN中重复计算的问题。RoI池化层可以将不同大小的候选区域映射为固定大小的特征图,从而使得所有候选区域可以共享相同的特征提取过程。这样一来,Fast R-CNN相比于R-CNN具有更快的速度。 Faster R-CNN是对Fast R-CNN的进一步改进,它引入了一个称为Region Proposal Network(RPN)的子网络来生成候选区域。RPN通过滑动窗口在特征图上提取候选区域,并为每个候选区域分配一个得分,然后根据得分进行筛选和排序。这种端到端的训练方式使得Faster R-CNN在目标检测任务上具有更高的准确性和更快的速度。 Mask R-CNN是在Faster R-CNN的基础上进一步发展的,它不仅可以进行目标检测,还可以进行实例分割。Mask R-CNN在Faster R-CNN的基础上增加了一个分支网络,用于预测每个候选区域中目标物体的像素级掩码。这使得Mask R-CNN能够同时获得目标的位置信息和像素级别的语义信息。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值