2019百度之星开发者大赛-复盘

本文回顾了2019年百度之星开发者大赛,重点探讨了目标检测算法,包括Two-Stage与Single-Stage网络的区别,SSD框架的优化,以及在MobileNet-V2架构上的模型量化、剪枝和共享权重等轻量化技术。文章还讨论了未来可能会选择YOLO V4的原因,以及深度学习的基础概念,如卷积层的角色。
摘要由CSDN通过智能技术生成
  • 进决赛时是前十名,之后因为队员的安排没有去北京参加路演答辩

  • 1、比赛介绍

  • 面向AI爱好者的深度学习算法竞赛——百度之星-开发者大赛,总之是为有创新力、专业性、团队合作精神和极客精神的顶级开发者团队提供真实的数据集+深度学习飞桨平台+一站式深度学习开发平台AI Studio

  • 模型小型化技术成为最近几年学术界和工业界研究的热点,模型小型化技术也从最开始的网络剪枝、知识蒸馏、参数量化等发展为最新的神经网络架构搜索(NAS)和自动模型压缩等技术。

  • 目标检测任务要找出图像中所有感兴趣的目标,确定它们的位置和大小,是计算机视觉领域的几个核心问题之一。首先是找出图像是否有给定类别的目标实例,如果有,返回每个目标实例的空间位置和覆盖范围。

    注意和目标识别的区分,目标识别是将图像看作整体来进行分类.。。。目标检测是给出的是对图片前景和 背景的理解,其主要分为两个子任务:目标定位和目标分类,要求从背景中分 离出感兴趣的目标并获得这一目标的类别信息和位置信息

  • 由于各类物体有不同的外观、形状、尺度和姿态,加上成像时的光照、遮挡等因素干扰,目标检测一直是计算机视觉领域最具有挑战性的问题之一

  • 目标检测算法从最早的 Two-Stage 算法:RCNN、faster-RCNN等,到 Single-Stage 算法:YOLO、SSD等,不仅在检测精度上有着巨大的提升,模型的复杂度和计算量也大大减少。即便如此,在移动嵌入式设备上进行实时处理目前仍然是一个巨大的挑战。相比只考虑精度的传统目标检测比赛,本次比赛在关注精度的同时,还将考虑整个算法效率

初赛:参赛系统模型,源代码,注释文档

决赛:前十名晋级决赛,之后我们因为时间安排的关系去不了北京现场路演,放弃了这次决赛的答辩机会

2、比赛题目介绍

  • 比赛目的:目标检测,检测出感兴趣目标在图像的位置和大小。

  • 参赛者需要提供一个飞桨模型,模型输出照片中每个目标的信息:boundingbox([x0,y0,x1,y1])、类别信息和分数

    bounding box指proposal经过再次精修后的预测框。

  • 训练和测试集使用COCO2017,该数据集包含80个类别,20W张图片的训练,验证和测试数据。

  • 排行榜的模型性能使用2017val进行评估,初赛截止的时候用2017test-dev进行评估(前20名)

  • 评价标准:本竞赛同时考虑模型的计算复杂度和精度,其中计算复杂度使用乘法累加次数(MAdds)计算,精度使用COCO评测集上的mAP,为了平衡模型的计算复杂度和精度,我们根据以往多个模型Madds和对应的mAP拟合了评估曲线。 最终的分数按如下公式计算:

                                 score = mAP - (k * log(MAdd) - a)
    
  • 仔细解读题目,可以看出基于深度学习的目标检测算法,虽然在精度方面超过了基于机器学习的传统目标检测算法,可是对硬件的要求却急剧上升-------------如何减少模型的运算时间,同时确保精确度较高。

3、Two_Stage和Singele-Stage网络的区别?

  • Single-Stage/One-Stage: 直接回归物体的类别概率和位置坐标值,速度快,准确度有降低

    直接通过主干网络给出类别和位置信息,没有使用RPN网路(区域生成网络)。这样的算法速度更快,但是精度相对Two-stage目标检测网络了略低。

    经典的One-Stage目标检测网络:YOLO , SSD ,DSSD, Retina-Net

  • Two-Stage: 先由算法生成一系列作为样本的候选框,再通过卷积神经网络进行样本分类。

    通过一个卷积神经网络来完成目标检测过程,其提取的是CNN卷积特征,在训练网络时,其主要训练两个部分,第一步是训练RPN网络,第二步是训练目标区域检测的网络。网络的准确度高、速度相对One-stage慢。

    经典的RNN,Faster-RNN

    首先输入一张图片,接着经过卷积神经网络,通过卷积神经网络对图片进行深度特征的提取,这个卷积神经网络称之为主干网络,典型的主干网络有VGGNet、ResNet 、Zenet等一些经典的卷积神经网络结构;接着通过RPN网络来进行候选区域产生的操作,同时也会完成区域的分类,即将图片分为背景和目标这样两种的不同的类别,并且也会对目标的位置进行初步的预测。

    接下来对候选区域中的位置进行精确定位和修正,使用Roi

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值