OFA one-for-all 通用多模态预训练模型

最新推荐文章于 2024-07-10 13:56:35 发布

谁怕平生太急

最新推荐文章于 2024-07-10 13:56:35 发布

阅读量257

点赞数 9

分类专栏：大模型文章标签：大模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jinselizhi/article/details/139324269

版权

大模型专栏收录该内容

21 篇文章 0 订阅

订阅专栏

使用简单的序列到序列的学习框架统一模态（跨模态、视觉、语言等模态）和任务（如图片生成、视觉定位、图片描述、图片分类、文本生成等）

ICML 2022：《OFA: Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence Learning Framework》

预训练当中的表征学习

（1）单模态的表征学习任务：

在这里插入图片描述

（2）跨模态的表征学习任务：

在这里插入图片描述

IO

在这里插入图片描述

训练推理

loss：交叉熵
推理：用前缀树的搜索策略替代beam search
前缀树

在这里插入图片描述

消融实验

在这里插入图片描述

谁怕平生太急

关注

9
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

谁怕平生太急 CSDN认证博客专家 CSDN认证企业博客

码龄9年

163: 原创

2万+: 周排名

1万+: 总排名

15万+: 访问

: 等级

3193: 积分

389: 粉丝

574: 获赞

8: 评论

623: 收藏

私信

关注

热门文章

分类专栏

大模型 21篇
读书笔记 5篇
算法基础 9篇
中医 5篇
刷题 3篇
阅读 52篇
Agent 14篇
大神 2篇
生活 13篇
RAG 1篇
架构 1篇
数据 1篇
开发 27篇
读文章
百面机器学习的读书笔记 5篇

最新评论

Qwen2-VL论文阅读笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
LangGraph介绍
青青草原一只狼: 博主有找到LangGraph的标准实例吗
最简单的网络
谁怕平生太急: import torch from torch.utils.data import DataLoader, Dataset import numpy as np # 自定义数据集 class CustomDataset(Dataset): def __init__(self, data, labels): self.data = data self.labels = labels def __len__(self): return len(self.data) def __getitem__(self, idx): sample = self.data[idx] label = self.labels[idx] return sample, label # 创建示例数据 data = np.random.random((100, 3, 32, 32)) labels = np.random.randint(0, 10, 100) # 创建数据集和数据加载器 dataset = CustomDataset(data, labels) dataloader = DataLoader(dataset, batch_size=8, shuffle=True, num_workers=2)
大模型之DPO
谁怕平生太急: DPO开始训练时，reference model和policy model都是同一个模型，只不过在训练过程中reference model不会更新权重。
多模态模型基础
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。