第四讲 深度学习预训练与MMPretrain

MMpreTrain算法库介绍

MMPretrain 是一个全新升级的预训练开源算法框架,旨在提供各种强大的预训练主干网络并支持了不同的预训练策略。
在这里插入图片描述
配置文件

  • 模型结构:构模型有几层、每层多少通道数等
  • 数据:数据集划分、数据文件路径、批大小、数据增强策略等
  • 训练优化:梯度下降算法、学习率参数、训练总轮次、学习率变化策略等
  • 运行时:GPU、分布式环境配置等
  • 辅助功能:如打印日志、定时保存 checkpoint 等
    代码框架
    在这里插入图片描述
    数据流
    在这里插入图片描述

经典主干网络

早期深度神经网络

  • AlexNet(2012)
  • VGG(2014)
  • GoogLeNet(2014)
    问题:精度退化问题——模型层数增加到一定程度后,分类正确率不增反降。
    分析:卷积退化为恒等映射时,深层网络与浅层网络相同所以,深层网络应具备不差于浅层网络的分类精度。
    猜想:虽然深层网络有潜力达到更高的精度,但常规的优化算法难以找到这个更优的模型即,让新增加的卷积层拟合一个近似恒等映射,恰好可以让浅层网络变好一点。
    残差建模:让新增加的层拟合浅层网络与深层网络之间的差异,更容易学习梯度可以直接回传到浅层网络监督浅层网络的学习没有引入额外参入,让参数更有效贡献到最终的模型中。

残差网络 Resnet(2015)

在这里插入图片描述

Vision Transformer(2020)

在这里插入图片描述
注意力机制Attention Mechanism
在这里插入图片描述

自监督学习

  • 基于各种代理任务
  • 基于对比学习
  • 基于掩码学习
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值