深度学习中,进行目标检测时降低误检率的可能方向汇总

文章探讨了提升目标检测模型性能的各种方法,包括使用FocalLoss和LabelSmoothing优化损失函数,应用nms和数据增强技术,如GAN放大小物体,增加训练图像尺寸,以及硬样本挖掘。在后处理阶段,提出先检测后识别,结合多帧判断和跟踪技术减少误检。此外,用户交互和特征匹配也被用于改进结果的准确性。
摘要由CSDN通过智能技术生成

目录

训练方面:

后处理方面:


训练方面:

1.Focal Loss

2.Label Smoothing

3.nms,soft-nms;提高准确率

4.Cosine Learning Rate Decay

5.利用GAN将小物体放大再检测,或者使用paddle中的切图与拼图训练(ppyoloe slice_infer)

6.增加训练输入图像尺寸,比如960,对于小尺寸目标检测效果会有提升,其他诸如iou、obj的阈值

7.最简单操作性最方便的就是数据增强,我多年前训练车牌识别就是基于opencv的Cascade,仅仅只通过数据增强的方式检测准确率就从60%提升到了85%+(时间久远mAP忘记了...)

可参考的数据增强方式有(以车牌为例):

  • 复制、缩放正样本,比如标记好的车牌裁剪出来粘贴到背景其他地方,同时随机缩放、仿射变换、透视变换、遮挡等等;
  • 生成正样本数据,适用于目标可以生成的情况,比如车牌,你准备好一个空的背景,准备好对应的字体,就可以无限生成数据;
  • 分析误识别的情况,针对性加入随机模糊、扭曲、色彩变换等增强

8.​​​​​​hard example mining(困难样本挖掘) 

对于目标检测中我们会事先标记处ground truth,然后再算法中会生成一系列proposals,proposals与ground truth的IOU超过一定阈值(通常0.5)的则认定为是正样本低于一定阈值的则是负样本。然后扔进网络中训练。However,这也许会出现一个问题那就是正样本的数量远远小于负样本,这样训练出来的分类器的效果总是有限的,会出现许多false positive把其中得分较高的这些false positive当做所谓的Hard negative,既然mining出了这些Hard negative,就把这些扔进网络再训练一次,从而加强分类器判别假阳性的能力

9.增加负样本:

  • 分析误检出来的负样本,同样复制、缩放到背景,只是没有标注框而已,同时还可以网上搜索一些类似的图加入训练
  • 如果总是对某种类型的目标误检,可以增加一些相应的样本到训练集中去,提高模型的分辨能力,可以在不降低召回的情况下降低误检。
  • 测试图像中被识别错误的物体所在区域,进行负样本生成(通常对原图像进行裁减,使得裁减下来的图像只包含误识别的物体,而不包含目)
  • 确定数据是否均衡

后处理方面:

1.先做检测,再做识别。

2.工程上来说,加入多帧判断策略区域位置 大小先验限制。

3.交互方式:

  • tracking。标记了是误检、然后去track,如果track到的框分数还很高,直接删。
  • 特征匹配。一旦出现误报,用户进行交互,误报的bbox就被当成一个template,把他的feature保存下来,接下来3分钟内如果还有要报的bbox,拿2个feature做similarity,如果很similar,就直接ignore不报警。只有当新的bbox和这个template bbox的feature similarity很低的时候,才报警。其实跟tracking很像,只不过简单点,能省点资源,毕竞feature similarity超级快。
  • 0
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
vidi深度学习外观检测技术是一种应用了深度学习算法的外观检测解决方案,可以用于检测和识别各种物体、人脸、文字等。虽然vidi深度学习外观检测技术在实践表现出色,但仍存在一些缺点需要注意。 首先,vidi深度学习外观检测技术对硬件设备要求较。由于深度学习模型具有复杂的网络结构和大量的参数,运行这些模型需要强大的计算和存储能力,因此在低配置的硬件设备上可能无法正常运行。 其次,vidi深度学习外观检测技术对数据集要求较深度学习模型的训练依赖于大量的标注数据,而且需要足够的多样性和代表性。如果提供给模型的数据集非常有限或者不具备代表性,可能导致模型的泛化能力较差,无法准确地进行外观检测。 另外,vidi深度学习外观检测技术在处理复杂场景可能存在误检和漏检的问题。由于外观检测涉及到多种物体、人脸或文字,而且场景可能存在遮挡、光照变化等干扰因素,深度学习模型可能会出现误判的情况。同,对于一些特殊形态或低对比度的物体,模型可能会漏检或者无法识别。 最后,vidi深度学习外观检测技术在保护用户隐私方面也存在一些问题。由于深度学习模型需要对输入的数据进行处理和分析,可能会涉及到用户隐私信息的泄露。因此,在将该技术应用于实际场景,需要谨慎考虑隐私保护的问题。 综上所述,vidi深度学习外观检测技术虽然应用广泛且有很的准确率,但仍然存在硬件要求、数据集要求、误检漏检问题以及隐私保护等方面的缺点。在实际应用,需要根据具体情况进行权衡和改进。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值