重要比赛历年冠军

深度学习知识点总结

专栏链接:
https://blog.csdn.net/qq_39707285/article/details/124005405

本专栏主要总结深度学习中的知识点,从各大数据集比赛开始,介绍历年冠军算法;同时总结深度学习中重要的知识点,包括损失函数、优化器、各种经典算法、各种算法的优化策略Bag of Freebies (BoF)等。

本章介绍各数据集以及历年冠军



1. 重要比赛历年冠军

1.1. 数据集

深度学习发展起来有几个关键的因素,一个就是庞大的数据(比如说ImageNet),一个是GPU的出现。(还有更优的深度模型,更好的优化算法,可以说数据和GPU推动了这些的产生,这些产生继续推动深度学习的发展)。

1.1.1. ImageNet

  • 包含超过1500万的图像数据集,大约有22,000个类别。
  • 该数据集由李飞飞团队从2007年开始,耗费大量人力,通过各种方式(网络抓取,人工标注,亚马逊众包平台)收集制作而成,它作为论文在CVPR-2009发布。当时人们还很怀疑通过更多数据就能改进算法的看法。
  • 数据集官网

1.1.2. PASCAL VOC

在这里插入图片描述

  • PASCAL VOC 挑战赛主要有 Object Classification 、Object Detection、Object Segmentation、Human Layout、Action Classification 这几类子任务。
  • PASCAL VOC 2007 和 2012 数据集总共分 4 个大类:vehicle、household、animal、person,总共 20 个小类(加背景 21 类),预测的时候是只输出下图中黑色粗体的类别。
  • 数据集官网

VOC 2007数据集图片/目标总数量统计。在这里插入图片描述

1.1.3. MS COCO

数据集官网
MS COCO的全称是Microsoft Common Objects in Context,起源于微软于2014年出资标注的Microsoft COCO数据集。
COCO数据集是一个大型的、丰富的物体检测,分割和字幕数据集。这个数据集以scene understanding为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的segmentation进行位置的标定。图像包括91类目标,328,000影像和2,500,000个label。目前为止有语义分割的最大数据集,提供的类别有80 类,有超过33 万张图片,其中20 万张有标注,整个数据集中个体的数目超过150 万个。
COCO数据集包含20万个图像;80个类别中有超过50万个目标标注,它是最广泛公开的目标检测数据库

1.2. 历年冠军

1.2.1 ImageNet的分类结果

年份网络/队名val error top-1val error top-5test top-5备注
2012AlexNet38.1%16.4%16.42%5 CNNs
2012AlexNet36.7%15.4%15.32%7CNNs。用了2011年的数据
2013OverFeat14.18%7 fast models
2013OverFeat13.6%赛后。7 big models
2013ZFNet13.51%ZFNet论文上的结果是14.8
2013Clarifai11.74%
2013Clarifai11.20%用了2011年的数据
2014VGG7.32%7 nets, dense eval
2014VGG(亚军)23.7%6.8%6.8%赛后。2 nets
2014GoogleNet v16.67%7 nets, 144 crops
GoogleNet v220.1%4.9%4.82%赛后。6 nets, 144 crops
GoogleNet v317.2%3.58%赛后。4 nets, 144 crops
GoogleNet v416.5%3.1%3.08%赛后。v4+Inception-Res-v2
2015ResNet3.57%6 models
2016Trimps-Soushen2.99%公安三所
2016ResNeXt(亚军)3.03%加州大学圣地亚哥分校
2017SENet2.25%Momenta 与牛津大学
2018PNASNet-517.1%3.8%
2019FixResNeXt-10113.6%2.0%ResNeXt
2020EfficientNet-L2-475(SAM)11.39%EfficientNet
2021CoAtNet-79.12%Transformer
2021Meta Pseudo Labels (EfficientNet-L2)9.8%EfficientNet
2022Model soups(ViT-G/14)9.06%Transformer

1.2.2 ImageNet的定位结果

年份网络/队名val top-1test top-5备注
2012AlexNet34.19%多伦多大学Hinton和他学生
2012AlexNet33.55%用了2011年的数据
2013OverFeat30.0%29.87%纽约大学Lecun团队
2014GoogleNet26.44%谷歌
2014VGG26.9%25.32%牛津大学
2015ResNet8.9%9.02%微软
2016Trimps-Soushen7.71%公安三所,以Inception, resNet, WRN等为基础
2017DPN6.23%新加坡国立大学与奇虎360

1.2.3 ImageNet的检测结果

年份网络/队名mAP(%)备注
2013OverFeat19.40使用了12年的分类数据预训练
2013UvA22.58
2013OverFeat24.3赛后。使用了12年的分类数据预训练
2014GoogleNet43.93R-CNN
2015ResNet62.07Faster R-CNN
2016CUImage66.28商汤和港中文,以GBD-Net等为基础
2017BDAT73.41南京信息工程大学和帝国理工学院

1.2.4.Object Detection on PASCAL VOC 2007

在这里插入图片描述

1.2.5.Object Detection on COCO test-dev

在这里插入图片描述


  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值