基础目标检测算法介绍:CNN、RCNN、Fast RCNN和Faster RCNN

本文介绍了目标检测的重要性及其在多个领域的应用,详细讲解了CNN、RCNN、Fast RCNN和Faster RCNN的工作原理及优缺点。通过对选择性搜索、卷积神经网络和Region Proposal Network的理解,阐述了这些算法如何逐步提升目标检测的效率和准确性。
摘要由CSDN通过智能技术生成

每次丢了东西,我们都希望有一种方法能快速定位出失物。现在,目标检测算法或许能做到。目标检测的用途遍布多个行业,从安防监控,到智慧城市中的实时交通监测。简单来说,这些技术背后都是强大的深度学习算法。

在这篇文章中,我们会进一步地了解这些用在目标检测中的算法,首先要从RCNN家族开始,例如RCNN、Fast RCNN和Faster RCNN。

1. 解决目标检测任务的简单方法(利用深度学习)

下图是描述目标检测算法如何工作的典型例子,图中的每个物体(不论是任务还是风筝),都能以一定的精确度被定位出来。

 

 

首先我们要说的就是在图像目标检测中用途最广、最简单的深度学习方法——卷积神经网络(CNN)。我要讲的是CNN的内部工作原理,首先让我们看看下面这张图片。

 

 

向网络中输入一张图片,接着将它传递到多个卷积和池化层中。最后输出目标所属的类别,听上去非常直接。

对每张输入的图片,我们都有对应的输出类别,那么这一技术能检测图片中多种目标吗?答案是肯定的!下面就让我们看看如何用一个卷积神经网络解决通用的目标检测问题。

1.首先,我们把下面的图片用作输入:

 

 

2.之后,我们将图片分成多个区域:

 

 

3.将每个区域看作单独的图片。

4.把这些区域照片传递给CNN,将它们分到不同类别中。

5.当我们把每个区域都分到对应的类别后,再把它们结合在一起,完成对原始图像的目标检测:

 

 

使用这一方法的问题在于,图片中的物体可能有不同的长宽比和空间位置。例如,在有些情况下,目标物体可能占据了图片的大部分,或者非常小。目标物体的形状也可能不同。

有了这些考虑因素,我们就需要分割很多个区域,需要大量计算力。所以为了解决这一问题&

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值