深度学习预预训练与MMPretrain

MMPretrain是一个强大的算法库,支持多种主干网络模型的自监督和多模态学习。它提供了丰富的数据集、训练策略和易用的API,包括图像分类、语义描述、视觉问答等任务。该库还允许用户配置GPU和分布式环境,优化训练效率。
摘要由CSDN通过智能技术生成

MMPretrain算法库

在这里插入图片描述
优势:

  • 含有各种主干网络模型
  • 自监督学习功能
  • 多模态学习功能
  • 丰富的数据集
  • 含有训练技巧和策略
  • 易用,例如可解释性分析、推理api

包含多种丰富任务的开箱即用推理api

  • 图像分类
  • 图像语义描述
  • 视觉问答
  • 视觉定位
  • 检索

在这里插入图片描述
安装步骤
在这里插入图片描述

配置文件中含有模型训练中的设置,影响精度和速度,主要涉及以下几个方面:

  • 模型结构
  • 数据
  • 训练策略
  • 运行时gpu、分布式环境配置
  • 辅助功能 日志、定时保存权重

代码框架以及各个目录的含义用法:
在这里插入图片描述
数据流
在这里插入图片描述
配置文件的运行方式:
在这里插入图片描述

经典主干网络

在这里插入图片描述

在这里插入图片描述
vision transformer
将图像切成若干16*16的小块,排列成“词向量”
在这里插入图片描述
注意力机制:为了实现层次化特征

后层特征是空间邻域内的前层特征的加权求和
在这里插入图片描述

自监督学习

不依赖人工标注,利用互联网上的海量数据
在这里插入图片描述

在这里插入图片描述

多模态算法

在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值