干货提炼|视觉小目标检测模型难点分析与突破

点击左上方蓝字关注我们

在百度与机器之心联合举办的【三小时 AI 开发进阶】系列公开课中,百度资深研发工程师倾囊相授,首节课关注视觉模型开发难点:解析小目标检测的技术原理并带来现场实战演示,让我们一文快速回顾本节课的核心干货!

 

???? 课程主题 ????

 视觉模型核心难点攻破:

 小目标检测技术详解与实战 

 

小目标检测场景分析与典型算法详解

在本节课中,讲师首先介绍了视觉 AI 技术-物体检测的技术发展历程,随着各种检测方法的提出与实践,技术在不断提升其自动化水平与检测效率,满足各类产业落地场景的应用需求。

 

 

在物体检测这一场景中,“小目标检测”由于实现难度大,是学者与开发者们研究的重点,那什么样的目标算是小目标呢?

以物体检测领域的通用数据集 COCO 物体定义为例,小目标是指小于32×32个像素点。在实际应用场景中,通常更倾向于使用相对于原图的比例来定义。因此,我们给出相对的定义,物体标注框的长宽乘积,除以整个图像的长宽乘积,再开根号,如果结果小于3%,就称之为小目标。

 

 

在应用中,小目标的场景也遍布各行各业,如卫星遥感检测、远距离物体人体检测、无人机航拍巡检缺陷检测、超市货架挡板商品检测等等。那么,为了更好地攻破小目标检测这一视觉模型难点,讲师从四个方面分别解析了场景难点与对应的解决方案。

 

那么结合实际案例,以上提到的小目标检测技术解决方案能对 AI 模型的效果有怎样的提升呢?在这个超市挡板商品检测模型中,最初的模型 mAP 是0.812,但经过 Anchor 优化、自动数据增强、自动超参搜索优化之后,模型 mAP 提高到0.92,精度提升超过13%!

 

在另一个无人机巡检场景中,最初的模型 mAP 为0.56,远达不到实际应用的要求。通过增加特征金字塔、Anchor 自适应算法、自动切图技术,模型 mAP 提升到0.93,精度提升超过66%,达到了业务应用的要求。

 

 

在以上介绍的全部案例中,是什么平台提供了相应能力呢?

 

EasyDL 助力企业快速开发高精度 AI 模型

面向企业应用开发者,百度推出了 EasyDL 零门槛 AI 开发平台,通过极简的交互体验,帮助零算法基础的企业用户快速上手,定制高精度 AI 模型。目前已经支持图像分类、物体检测、图像分割、音视频分类、语音识别、OCR、表格数据预测、文本分类、情感倾向分析等任务类型,EasyDL 提供覆盖数据处理、模型训练与服务部署的全流程功能,助力企业快速打造智能化应用。

EasyDL 是基于飞桨开源深度学习平台构建,为用户提供一站式的模型定制开发和服务。在数据管理中,用户可以享受到完善安全的数据服务,包括端云一体的数据采集方案、高级数据清洗、数据扩充、智能标注与近期上线的多人协同标注能力,在多个环节持续提升数据处理效率。

在模型构建环节中,EasyDL 支持用户零代码、自动化进行模型训练。在开发者最关注的模型精度问题上,EasyDL 预置了百度自研的语义理解模型文心 ERNIE2.0 与视觉超大规模预训练模型,并提供迁移学习、自动超参搜索、自动数据增强等工具组件,能够让开发者用更少的数据与开发量,获取更优质的效果。

在满足精度的同时,为提升训练效率,EasyDL 在训练流程中也做了优化,例如分布式训练加速,用户可以自主选择多机多卡的模式,更高效地完成训练流程。同时,为了帮助用户在模型训练后快速了解模型、有针对性地进行模型调优,EasyDL 支持在线查看模型的多种指标,包括精确率、召回率、F1-score、mAP 等,也有热力图、混淆矩阵等功能更好地对模型效果进行归因分析。

值得一提的是,EasyDL 的物体检测模型,使用百度自研超大规模预训练模型的 YOLOv3_DarkNet 相比普通模型在各类数据集上模型效果平均提升4.53 %、Faster_RCNN 相比于普通预训练模型平均提升1.39%。并且在物体检测模型中,EasyDL 针对多种场景预置了自适应训练优化机制,并提供了适应广泛业务场景的算法选型,并且在不断根据市场需求进行优化。立足于各类企业应用场景,提供兼具高精度与高性能的模型训练机制。

企业在 AI 应用时,往往面临部署的“最后一公里”问题。为此,EasyDL 提供了灵活的端、边、云多种部署方案,用户可根据业务应用场景要求选择公有云、设备端、私有化、软硬一体的部署方式,更快更好地让 AI 赋能于各类行业与场景。

 

目前,EasyDL 已经在工业制造、安全生产、零售快消、智能硬件、互联网等超过20个行业广泛落地。

 

另外,百度还推出了 BML 全功能 AI 开发平台 (Baidu Machine Learning),面向企业和个人开发者提供易用的开发环境、丰富的功能组件与高性价比的算力资源,完成 AI 开发的全生命周期管理,助力高效构建高精度 AI 应用。在模型构建这一环节中,BML 支持 Notebook、脚本调参、自定义作业的建模方式,给予开发者更高的灵活度,完成高精度模型的定制开发。

 

在课程中还有讲师实战演示,不到十分钟完成高精度目标检测模型训练,mAP 达到98.3%。点击回放视频获取同款开发技能!

 

下节课的内容提炼关注如何使用 BML 进行模型算法高效调参,提升模型精度,工程师进阶之路上,不要错过这一课!

 

课程回放与 QA 实录:

https://ai.baidu.com/forum/topic/show/981360

EasyDL 官网:

https://ai.baidu.com/easydl/

 

???? 点击“阅读原文”,立即回顾课程全部内容

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值