视觉特征在语言空间中如何分布？武大、上海交大提出统一多模态自回归建模框架...

最新推荐文章于 2024-08-13 08:57:20 发布

PaperWeekly

最新推荐文章于 2024-08-13 08:57:20 发布

阅读量770

点赞数 19

文章标签：回归数据挖掘人工智能机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/137096165

版权

研究者提出VW-LMM，一种通过视觉词表示视觉特征的多模态模型，解决了LMM中处理连续视觉嵌入的难题，实现统一目标的多模态自回归建模，提升模型的视觉-语言理解能力。

摘要由CSDN通过智能技术生成

©PaperWeekly 原创 · 作者 | 彭天硕

单位 | 武汉大学本科生

研究方向 | 多模态理解与生成

大型语言模型（LLMs）通过在大规模未注释文本语料库上执行自回归建模方法，展现出强大的感知和推理能力。然而，将自回归建模扩展到多模态场景以构建大型多模态模型（LMMs）时，存在一个很大的困难，即图像信息在 LMM 中被处理为连续的视觉嵌入，无法获得离散的监督标签用于进行分类损失计算。

在本文中，研究者首次成功地进行了采用统一目标的多模态自回归建模，并且进一步探讨了 LLMs 内部语义空间中视觉特征的分布以及使用文本嵌入来表示视觉信息的可能性。

论文题目：

Multi-modal Auto-regressive Modeling via Visual Words

论文地址：

https://export.arxiv.org/abs/2403.07720

代码地址：

https://github.com/pengts/VW-LMM

Hugging Face库：

https://huggingface.co/MYTH-Lab/VW-LMM-Vicuna-7b

https://huggingface.co/MYTH-Lab/VW-LMM-Mistral-7b

https://huggingface.co/MYTH-Lab/VW-LMM-Vicuna-pif-7b

动机

得益于在大规模未标记文本上执行自回归建模方法，大型语言模型（LLMs）能够从自然语言语料库中学习通用的语义信息和强大的推理能力。然而，对于将自回归建模扩展到多模态场景而言，存在一个很大的困难，即图像信息在 LMM 中被处理为连续的视觉嵌入，无法获得离散的监督标签用于分类损失计算。

最低0.47元/天解锁文章

关注

19
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
视觉特征在语言空间中如何分布？武大、上海交大提出统一多模态自回归建模框架...

©PaperWeekly 原创 ·作者 |彭天硕单位|武汉大学本科生研究方向 |多模态理解与生成大型语言模型（LLMs）通过在大规模未注释文本语料库上执行自回归建模方法，展现出强大的感知和推理能力。然而，将自回归建模扩展到多模态场景以构建大型多模态模型（LMMs）时，存在一个很大的困难，即图像信息在 LMM 中被处理为连续的视觉嵌入，无法获得离散的监督标签用于进行分类损失计算。在本文中，...
复制链接

扫一扫

PaperWeekly CSDN认证博客专家 CSDN认证企业博客

码龄7年

1451: 原创

4731: 周排名

167: 总排名

555万+: 访问

: 等级

4万+: 积分

8707: 粉丝

6607: 获赞

1002: 评论

2万+: 收藏

私信

关注

热门文章

最新评论

博士申请 | 香港理工大学MIND实验室招收EEG信号处理/语音增强方向全奖博士/博后...
m0_68606608: 你好，请问实验室官网上有标明招收EEG方向的phd吗？我似乎没搜到
NeurIPS 2022｜探明图对比学习的“游戏规则”：谱图理论视角
m0_52089040: 文章中的很多符号不见了
大语言模型之生成/推理：参数与解码策略原理及其代码实现
大袖揽清风。: say进行分词应该是一个token吧。送入网络前的shape不应该是(b,seq_len)吗？讲道理shape应该是(1,1)才对，张量应该是[[1827]]啊？为什么是[[1,1827]]?
字节跳动 2019 ICME 双赛道冠军团队方案分享
weixin_51042469: 博主您好，请问数据集可以分享嘛？
ACL 2024 | OceanGPT（沧渊）：面向海洋科学任务的大型语言模型初探
眕眕: 实测效果：问：直接汇入东海的河流有哪些答：东海沿岸有几个河流直接注入东海。其中一些主要河流包括: 1.松江:位于上海市，长江的主要支流，在上海市区附近汇入东海。 2.长江:世界上第三长的河流，也是长江的主要支流。它发源于中国西南地区，最终在上海市附近汇入东海。 3.淮河:位于中国东部，淮河在江苏省的淮安市附近汇入东海。 4.淮阳河:位于中国东部，淮阳河在江苏省的淮安市附近汇入东海。 5.淮河:位于中国东部，淮河在江苏省的淮安市附近汇入东海。 6.珠江:珠江是中国的第二长河流，最终在广东省的香港特别行政区附近汇入南海，包括东海。 7.黑龙江:黑龙江是中国最长的河流，最终在黑龙江省的哈尔市附近汇入东海。这些河流在东海沿岸地区起着重要的水循环作用，并对当地的水文和生态平衡产生影响。

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。