【6.5】OpenMMLab实战营课程笔记⑤

MMPreTrain是一个预训练算法框架,源于MMClassification和MMSelSup,支持多种预训练模型和训练策略。它提供了多模态算法库,并包含全面的文档和代码仓库。安装过程包括基础和多模态选项。框架包括APIs、datasets、engine、evaluation、models等关键组件,用于构建和训练深度学习模型,特别是图像识别任务。残差建模和注意力机制是其核心技术之一。
摘要由CSDN通过智能技术生成

深度学习预训练与MMPreTrain

 

【MMPretrain定义】

--是一个全新升级的预训练开源算法框架。

--旨在提供各种强大的预训练主干网络,并支持了不同的训练策略。

--源自MMClassification和MMSelSup,且融入了多模态算法库。

--文档教程

--代码仓库

【MMPreTrain安装步骤】

--基础安装

conda create -n open-mmlab python=3.8
pytorch==1.10.1 torchvision==0.11.2 cudatoolkit=11.3-c pytorch -y
conda activate open-mmlab
pip install openmim
git clone http://github.com/open-mmlab/mmpretrain.git
cd mmpretrain
mim install -e . 

--多模态安装

mim install -e ".[multimodal]"

可以使用MIM配置MMCV,MMEngine和 MMPreTrain。

【配置文件】

深度学习模型的训练涉及几个方面:

【代码框架】

 

--apis:顶层api接口,支持各类推理任务

--datasets:支持了各类数据集,数据变换等

--engine:各类评测相关函数和指标计算

--evaluation:各类评测相关函数和指标计算

--models:各类算法模型的定义:

   * backbones:一般为图像的特征提取器,各类主干网络的定义

   * necks:则为承接backbone和head之间的其他计算(例如高维特征解码,多尺度特征融合等)

   * heads:则主要为相关loss计算和推理结果的预测

   * classifier、selfsup、multimodal:为模型高阶抽象定义

--structures:DataSample数据结构的定义

--utils:相关工具

--visualization:可视化的支持

【数据流】

【配置文件的运作方式】

 【残差建模】

--让新增加的层拟合浅层网络与深层网络之间的差异,更容易学习梯度可以直接回传到浅层网络监督浅层网络的学习。

--没有引入额外参数,让参数更有效贡献到最终的模型中。

【Attention for 1D data】

【Multi-head】 

 【课程参考】

深度学习预训练与MMPretrain

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值