基于深度学习的目标检测算法调研

0 目标检测的任务概述

如何从图像中解析出可供计算机理解的信息,是机器视觉的中心问题。理解图像,有三个主要的层次:

理解图像

  1. 一是分类(Classification),即是将图像结构化为某一类别的信息,用事先确定好的类别(string)来描述图片。这一任务是最简单、最基础的图像理解任务,也是深度学习模型最先取得突破和实现大规模应用的任务。
  2. 二是检测(Detection)。检测则关注特定的物体目标,要求同时获得这一目标的类别信息和位置信息。相比分类,检测需要从背景中分离出感兴趣的目标,并确定这一目标的类别和位置。
  3. 三是分割(Segmentation)。分割包括语义分割(semantic segmentation)和实例分割(instance segmentation),前者要求分离开具有不同语义的图像部分,而后者是检测任务的拓展,要求描述出目标的轮廓(相比检测框更为精细)。分割是对图像的像素级描述,它赋予每个像素类别意义,适用于理解要求较高的场景,如无人驾驶中对道路和非道路的分割。

1 基于深度学习的「目标检测」算法

深度学习时代来临后,「目标检测」算法大家族主要划分为两大派系,一个是 R-CNN 系两刀流派,另一个则是以 YOLO 为代表的一刀流派。下面分别解释一下 两刀流一刀流:

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
目标检测是计算机视觉领域的一个重要任务,它的发展历程可以分为以下几个阶段: 1. 基于手工特征的方法:最早的目标检测方法是基于手工设计的特征,例如Haar特征、HOG特征等。这些方法需要人工设计特征,计算量大,且对光照、姿态等变化敏感。 2. 基于机器学习的方法:随着机器学习算法的发展,目标检测方法开始使用机器学习算法来自动学习特征。其中比较典型的算法是基于AdaBoost的Viola-Jones算法和基于支持向量机(SVM)的方法。 3. 基于深度学习的方法:深度学习的出现使得目标检测方法得到了质的飞跃。最早的深度学习目标检测算法是R-CNN系列算法,它们将目标检测问题转化为分类问题,先使用选择性搜索等算法提取候选框,再对每个候选框进行分类。后来,Fast R-CNNFaster R-CNNYOLO、SSD等算法相继提出,将候选框的生成和分类合并到一个网络中,进一步提高了检测速度和准确率。 4. 单阶段目标检测算法:为了进一步简化目标检测算法,单阶段目标检测算法应运而生。这类算法包括YOLOv3、RetinaNet、EfficientDet等,它们将目标检测问题转化为一个回归问题,直接输出目标的位置和类别,不需要生成候选框,从而更加高效和精确。 总之,随着深度学习技术的不断发展,目标检测算法的效果和速度得到了极大的提升,成为计算机视觉领域研究的热点之一。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值