多目标检测

图像分类

这是最简单的情形,只需要判定一张图片是属于哪一个类别即可。这种图像往往有一个非常显著的特殊,就是图像主体清晰且突出。
但是日常生活中这类图像并不多,更多的是一张图片中包含了多个主体,此时单纯的目标分类就无法满足了,需要使用多目标检测。

多目标检测

顾名思义,其的作用就是检测一个图片上的多个目标,它不仅仅能把目标找到(该目标在图像中的位置),还能给出其的具体类别。

锚框

这是一个框住目标物体的框,一般通过二维坐标来表示。
锚框生成有多种算法,但是生成的锚框质量好坏就决定着算法的整体性能。

类别检测

相比于图像分类,只输出一个对应的类别,多目标检测需要输出更多的东西。
一个显而易见的事情,并不可能枚举出所有的锚框,并对其一一进行检测。那么对于有限个锚框,如何来表示图片中无数种锚框的可能?这里就需要用到一个偏移,也就是预测的锚框位置与当前检测锚框的差别。

  • 如何理解这个偏移
    假设现在锚框框住了一朵向日葵的大部分,如下图(红色的框):
    在这里插入图片描述
    对于图像分类来说,大部分的向日葵足以完成分类,即它可以给出一个标签。但是此时还需要一个偏移,红色框与黑色框之间的差别。也就是说,神经网络还需要学习一种推断能力:从大半朵向日葵中推断出整朵向日葵所处在的位置。

训练

相比于图像分类,多目标检测的样本可谓是更少了,因为它的标注成本更高,因此利用好手中的数据也是同样重要。
对于图像分类部分,即给出标签的网络,往往是利用现有的图像分类模型。
对于偏移部分,可以对一张照片生成多个锚框,就可以得到多个训练样本。

预测

一般多目标检测分为如下步骤:

  1. 生成大量的锚框,有各种各样的算法能生成高质量的锚框。
  2. 利用神经网络预测类别标签与偏移,但是如果其类别标签的置信度过低,往往可能是背景,应当舍弃。
  3. 通过偏移,生成预测的锚框。
  4. 将重叠面积较大的锚框进行删除,保留类别置信度最高的一个。对于上面的图片,红色和黑色的锚框有着大量的重叠面积,应当只保留一个。显然黑色的置信度更高,因此只保留黑色的。
  5. 输出最终结果。
  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
OpenCV模板匹配是一种基于图像相似度的目标检测方法。它通过在输入图像中寻找与给定模板最相似的局部区域来实现目标检测。在多目标检测中,我们可以使用模板匹配方法来识别多个目标。 首先,我们需要准备好目标的模板图像。这是我们想要检测的目标的一个样本图像。然后,我们需要加载输入图像,这是我们要在其中进行目标检测的图像。 接下来,我们可以使用OpenCV的模板匹配函数(如matchTemplate)来在输入图像中寻找与模板图像最相似的区域。该函数将返回每个匹配的相似度值。我们可以选取相似度最高的匹配结果作为目标的检测结果。 如果我们想要检测多个目标,我们可以采用不同的方法。一种方法是使用滑动窗口的技术,将输入图像划分为多个窗口,并在每个窗口上进行模板匹配。另一种方法是使用多尺度的技术,对输入图像进行多个尺度的缩放,并在每个尺度上进行模板匹配。 需要注意的是,模板匹配方法在目标和背景之间的对比度较高时效果较好。当目标和背景之间的对比度较低时,模板匹配方法可能无法准确地检测目标。 总结而言,OpenCV的模板匹配方法可用于多目标检测。它可以通过找到输入图像中与给定模板最相似的区域来实现目标的定位。在多目标检测中,我们可以使用滑动窗口或多尺度的技术来识别多个目标。然而,需要注意的是,模板匹配方法对目标和背景之间对比度的要求较高。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值