基于深度学习的目标检测算法(一)

  • Two-stage(Faster RCNN系列)
  • One-stage(YOLO和SSD系列)

1. Two-stage基本介绍

  • CNN卷积特征
  • R.Girshick et al.,2014年提出R-CNN到Faster RCNN
  • 端到端的目标检测(RPN网络)
  • 准确度高、速度相较于one-stage慢

1.1 基本流程

1.2 核心组件

1.2.1 CNN卷积神经网络

一般CNN设计原则:

  • 一是从简到繁再到简的卷积神经网络。最开始的卷积神经网络是比较简单的,最经典的是Lenet,但是它的性能就相对较差,在大规模的任务中就会到达瓶颈,在网络中的表达能力就相对弱一些。之后又提出了Alexnet,VGGnet,Resnet,Goolenet,Densenet等等一些复杂的网络。这些网络发展主要是分为两个方向,一是增加网络的深度,尽可能的去增加网络深度,因为网络越深,它的非线性表达能力越强,在现实生活中,我们遇到的问题一般都是非线性的,因此这样可以得到物体更抽象的表达,而且网络越深,它对于图像 最初的一些变化更加不敏感,即鲁棒性更好,但是这样会出现两种问题,增加网络的规模,也会导致梯度消失或者说是梯度弥散的问题。二是增加网络的宽度,通过加大网络的宽度来增强网络的表达能力,比较有代表性的就是谷歌提出来的一系列 Inception 结构。
  • 更轻量级的CNN网络。之后在设计网络时考虑性能和网络模型大小的平衡,其中比较具有代表性的就包括了Mobilenet,ShuffleNet等。
  • 多尺度融合网络。通过融合不同尺度下的特征来提高网络的表达能力。

1.2.2 RPN 网络

  • 区域推荐(Anchor机制)
  • ROI Pooling
    输入:特征图、rois以及ROI参数; 输出:固定尺寸的的feature map
  • 分类和回归

1.3 改进方向

  1. 更好的网络特征;
  2. 更精准的RPN;
  3. 更完善对的ROI分类
  4. 样本后处理
  5. 更大的mini-Batch

2. Two-stage 常见算法

在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
目标检测是计算机视觉领域的一个重要任务,它的发展历程可以分为以下几个阶段: 1. 基于手工特征的方法:最早的目标检测方法是基于手工设计的特征,例如Haar特征、HOG特征等。这些方法需要人工设计特征,计算量大,且对光照、姿态等变化敏感。 2. 基于机器学习的方法:随着机器学习算法的发展,目标检测方法开始使用机器学习算法来自动学习特征。其中比较典型的算法是基于AdaBoost的Viola-Jones算法和基于支持向量机(SVM)的方法。 3. 基于深度学习的方法:深度学习的出现使得目标检测方法得到了质的飞跃。最早的深度学习目标检测算法是R-CNN系列算法,它们将目标检测问题转化为分类问题,先使用选择性搜索等算法提取候选框,再对每个候选框进行分类。后来,Fast R-CNN、Faster R-CNN、YOLO、SSD等算法相继提出,将候选框的生成和分类合并到一个网络中,进一步提高了检测速度和准确率。 4. 单阶段目标检测算法:为了进一步简化目标检测算法,单阶段目标检测算法应运而生。这类算法包括YOLOv3、RetinaNet、EfficientDet等,它们将目标检测问题转化为一个回归问题,直接输出目标的位置和类别,不需要生成候选框,从而更加高效和精确。 总之,随着深度学习技术的不断发展,目标检测算法的效果和速度得到了极大的提升,成为计算机视觉领域研究的热点之一。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值