OpenMMLab AI笔记10——深度学习预训练与MMPreTrain

MMPreTrain是OpenMMLab的一个新框架,融合了MMSelfSup和MMClassification,支持多模态预训练和多种任务。它提供丰富的预训练模型、数据集和推理API,包括图像分类、图像描述等任务。经典主干网络如ResNet和Vision Transformer在其中得到应用,ResNet以残差结构著称,而Vision Transformer利用注意力机制进行全局特征学习。
摘要由CSDN通过智能技术生成

以下文字仅是一个入门小白的课堂笔记分享,如有不妥之处,恳请各位朋友指出!


MMPreTrain算法库介绍

  • 算法库与任务组成

MMPreTrain是一个新的升级框架,它源自于MMSelfSup和我们熟悉的MMClassification,因为这两个算法库在模型功能等一些方面存在重合的部分,核心开发者便把他们合成MMPreTrain,旨在成为一个易于使用和用户友好的代码库,并简化学术研究和工程任务。另外,MMPreTrain也合入了多模态相关的功能,支持多种多模态算法和下游任务。

  • 框架概览

 (图源OpenMMLab AI实战营PPT  下同)

MMPreTrain除了有以上丰富的预训练模型、多种数据集,还支持开箱即用的推理API和模型,包含的相关任务有:图像分类(Image Classification)、图像描述(Image Caption)、视觉问答(Visual Question Answering)、视觉定位(Visual Grounding)、检索(Retrieval,Image-To-Image,Text-To-Image,Image-To-Text)。

MMPreTrain

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值