清华丁霄汉:从RepVGG系列谈起,结构重参数化如何暴力提升性能

本文介绍了清华大学丁霄汉博士关于结构重参数化的研究,特别是RepVGG系列模型,该模型在计算机视觉任务中展现出优秀的性能和效率。结构重参数化方法通过在训练时增加分支并在推理时简化结构,实现了性能的提升。RepVGG已在多个公司和比赛中应用并获奖。此外,文中还探讨了ACNet和DBB等模型的设计元素和结构重参数化的应用。
摘要由CSDN通过智能技术生成

专栏:前沿进展】“结构重参数化”是清华大学丁霄汉博士近年来提出的一种通用深度学习模型设计方法论。在青源 Live 第 34 期中,丁霄汉博士分享了题为「结构重参数化与通用视觉模型的基本设计元素」的报告,介绍了结构重参数化的起源和发展,以及他基于这一思想在改进单分支模型性能、设计卷积模型组件、模型剪枝等方向的相关研究工作。

4ab73b27599b0480b464b5993d5d6b13.png

本文整理自青源 LIVE 第 34 期,视频回放链接:

https://hub.baai.ac.cn/live/?room_id=210

主讲:丁霄汉 

整理:熊宇轩  

审校:李梦佳

b4aa4536ab972e1c29e9614b214bf060.png

丁霄汉博士基于“结构重参数化”思想设计的 RepVGG 系列模型已被旷视力、腾讯优图、云从科技、京东等公司应用于计算机视觉业务。Speakin 公司也使用该模型在“VoxCeleb Speaker Recognition”语音识别挑战赛中获得了冠军。该模型还被广泛应用于“Real-Time Quantized Image Super-Resolution on Mobile NPUs”等比赛,取得了不俗的成绩。此外,丁博士开发的 ACNet 和 DBB 被商汤科技用于著名的人脸识别大赛 MFW 2021,并获得了该赛事的冠军。

ae0ffeccd639affdefbd22764a0a285f.png

就学术界而言,结构重参数化思想近年来被广泛认可,研究者们将其应用于神经网络架构搜索(NAS)、语义分割等方面。例如,Yolov4 的作者 Alexey Bochkovskly 和 ImageNet 的作者 Jie Deng 教授在论文「Non-Deep Networks」中大量使用了结构重参数化方法。

4c788b55578b45b0c59461f63f0ac7fb.png

以 RepVGG 为例,这种主干网络在精度和运算速度之间实现很好的折中,目前已获得 2100+ 的 Github stars。如上图所示,极简的 RepVGG 网络的准确率优于一些流行的主干网络。特斯拉研究总监Andrej Karpathy还在推特上推荐过RepVGG。

  • 3
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值