使用简单的序列到序列的学习框架 统一模态 (跨模态、视觉、语言等模态)和任务(如图片生成、视觉定位、图片描述、图片分类、文本生成等)
ICML 2022: 《OFA: Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence Learning Framework》
预训练当中的表征学习
(1)单模态的表征学习任务:
(2)跨模态的表征学习任务:
IO
训练推理
loss:交叉熵
推理:用前缀树的搜索策略替代beam search
前缀树