OFA one-for-all 通用多模态预训练模型

使用简单的序列到序列的学习框架 统一模态 (跨模态、视觉、语言等模态)和任务(如图片生成、视觉定位、图片描述、图片分类、文本生成等)

ICML 2022: 《OFA: Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence Learning Framework》

预训练当中的表征学习

(1)单模态的表征学习任务:

在这里插入图片描述

(2)跨模态的表征学习任务:

在这里插入图片描述

IO

在这里插入图片描述

训练推理

loss:交叉熵
推理:用前缀树的搜索策略替代beam search
前缀树

在这里插入图片描述

消融实验

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值