【深度学习基础】主流目标检测算法简介

📢:如果你也对机器人、人工智能感兴趣,看来我们志同道合✨
📢:不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852
📢:文章若有幸对你有帮助,可点赞 👍 收藏 ⭐不迷路🙉
📢:内容若有错误,敬请留言 📝指正!原创文,转载请注明出处


Googlenet

目标检测算法

在这里插入图片描述

CNN

在2012年的ImageNet的图像识别竞赛中,Krizhevsky 等人通过CNN模型来实现图像的分类,其获得的识别准确率远远超越其他的参赛者,CNN模型由此在学术界获得了跟多的关注度,由此目标识别便有了新的研究方向,这种发展对于目标识别来说是突破性的。

R-CNN

Girshick是第一个将R-CNN成功地将深度学习应用于目标识别的研究,该算法首先利用选择性搜索从图像中提取2000个候选区域,然后将这些候选区域输入到卷积神经网络中提取每个候选区域的特征点,最后利用训练好的分类器进行分类识别。R-CNN减少了人为干扰,然而由于每幅图像都需要选择2000个候选区域,处理时间过长,无法实现实时目标识别。此外,选择搜索算法是固定的,没有学习过程,这可能导致不良候选区域的出现。

Fast R-CNN

在R-CNN的基础上,Girshick不断改进,提出了一种与R-CNN算法相似的快速算法Fast R-CNN,但它与R-CNN不同的是其不向CNN提供候选区域,而是在生成特征图时将将完整的图像通过CNN卷积,候选区域通过之前生成的卷积特征图相应的特征来确定。将选出的感兴趣区域通过融合层的处理得到相应尺寸的图像,然后学习图像,而不是每次向卷积神经网络提供2000个候选区域,FastR-CNN对每个图像只执
行一次卷积运算,以此来提升算法的运行效率。R-CNN与Fast R-CNN都是通过选择性搜索来确定感兴趣区域的,然而选择性搜索的时间消耗成本较大,这在极大程度.上影响了识别网络的性能。

Faster R-CNN

针对R-CNN与Fast R-CNN的这个缺点,邵少仁提出了一种快速目标检测算法Faster R-CNN,与Fast R-CNN不同的是,FasterR-CNN使用单独的网络预测候选区域,然后使用感兴趣区域融合层重构预测的候选区域,最后,对候选区域内的图像进行分类并预测边界框的偏移量。R-CNN、FastR-CNN和FasterR-CNN都使用候选区域来检测图像中物体的输入,网络不会看到完整的图像,但会检测到图像中目标物体较高的区域。

SSD

通过对Fast R-CNN和YOLO各自优缺点的分析,Liu等人采用VGGl6作为预训练网络模型,于2015年发布了SSD算法。在VGGl6预训练网络模型中,通过13个卷积层及3个全连接层保驾护航,使得SSD算法具有了与Fast R-CNN般的性能,与此同时使其的时间成本消耗低于YOLO。SSD算法为了保证多尺度的预测性能,在通过预训练模型之后,再通过了卷积层来进行卷积,以此减小了层的张量。该算法通过比较预测目标类别和所属类别的得分,并利用小卷积滤波器预测一系列边界盒来完成目标识别。

YOLO

reference:
OpenCV中使用YOLO对象检测
一文读懂YOLOv5 与 YOLOv4
You Only Look Once - YOLO
YOLO是一种比SSD还要快的对象检测网络模型,算法作者在其论文中说FPS是Fast R-CNN的100倍,
1.是一种基于深层神经网络的目标识别与定位算法。
2.它最大的特点是运行速度快,可用于实时系统。
3.目标检测的核心就是YOLO。YOLO系列也一直在发展,对于它的学习迫在眉睫。

在这里插入图片描述
OpenCV在3.3.1版本中开始支持Darknet,可能有人会问,Darknet是什么鬼,它是YOLO的作者自己搞出来的深度学习框架,支持C/C++/Python语言,支持YOLOv1、YOLOv2、YOLOv3等网络模型训练与使用。

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
目标检测是计算机视觉领域的一个重要研究方向,其目的是在图像或视频中识别和定位特定物体。在深度学习的发展过程中,目标检测算法也得到了广泛的应用。目前,主流目标检测算法主要包括两类:基于区域的检测方法和基于回归的检测方法。 基于区域的检测方法是在图像中提取一些候选区域,然后对每个候选区域进行分类和定位。其中,最具代表性的算法是RCNN(Region-based Convolutional Neural Network)。RCNN首先使用选择性搜索(Selective Search)算法选取候选区域,然后对每个候选区域进行卷积特征提取和分类定位。由于计算量巨大,RCNN的训练和测试过程分别需要多个步骤,效率较低。 基于回归的检测方法则是直接对图像中的每个像素进行分类和定位。其中,最具代表性的算法是YOLO(You Only Look Once)。YOLO将图像分成网格,并对每个网格预测物体类别和边界框。相比于基于区域的检测方法,YOLO具有更快的检测速度和更高的精度,但对小物体的检测效果不如基于区域的方法。 目标检测算法的理论基础主要包括卷积神经网络、损失函数和非极大值抑制等。卷积神经网络是目标检测算法的核心,其通过多层卷积和池化操作提取图像特征,并将特征映射到物体类别和边界框上。损失函数则是目标检测算法优化的关键,其通过最小化模型输出与真实标签之间的差距来提高模型的精度。非极大值抑制是目标检测算法的后处理步骤,其通过去除重叠的边界框,提高模型的检测精度。 总的来说,深度学习目标检测算法的理论基础是非常丰富的,不同的算法有各自的特点和优劣势,需要根据实际应用场景进行选择和优化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

嵌小超

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值