Meta-Transformer:多模态学习的统一框架

9a7bb35d755867ec12c6a0f0a97e2d64.png

来源:专知
本文约500字,建议阅读5分钟
Meta-Transformer由三个主要组件组成。

617f5adeba8b5e8137757dd0aa99634d.png

但由于它们之间固有的差距,设计一个用于处理各种模态(例如自然语言、2D图像、3D点云、音频、视频、时间序列、表格数据)的统一网络仍然具有挑战性。在这项工作中,我们提出了一个名为Meta-Transformer的框架,它利用一个固定的编码器在没有任何成对的多模态训练数据的情况下执行多模态感知。在Meta-Transformer中,来自各种模态的原始输入数据被映射到一个共享的令牌空间,允许一个具有固定参数的后续编码器提取输入数据的高级语义特征。Meta-Transformer由三个主要组件组成:一个统一的数据令牌化器、一个模态共享的编码器和用于下游任务的任务特定头部。Meta-Transformer是第一个能够在12种模态上执行统一学习并使用非配对数据的框架。在不同基准上的实验显示,Meta-Transformer可以处理包括基本感知(文本、图像、点云、音频、视频)、实际应用(X射线、红外、超光谱和IMU)和数据挖掘(图、表格和时间序列)在内的广泛任务。Meta-Transformer为使用变换器开发统一的多模态智能展示了一个有前景的未来。代码将在 https://github.com/invictus717/MetaTransformer 上提供。

58d3e6d158350188412971665115ba43.png

311cee23734e4fd04f077b17091e1b44.png

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Meta-Transformer是一个框架,用于处理不同模态(例如自然语言、2D图像、3D点云、音频、视频、时间序列、表格数据)的多模态任务。它的核心思想是利用一个固定的编码器在没有任何成对的多模态训练数据的情况下执行多模态感知。 在Meta-Transformer中,来自各种模态的原始输入数据被映射到一个共享的令牌空间,这允许一个具有固定参数的后续编码器提取输入数据的高级语义特征。Meta-Transformer由三个主要组件组成:一个统一的数据令牌化器、一个模态共享的编码器和用于下游任务的任务特定头部。 Meta-Transformer是第一个能够在12种模态上执行统一学习并使用非配对数据的框架。实验结果显示,Meta-Transformer在各种基准任务上表现良好,包括基本感知(文本、图像、点云、音频、视频)、实际应用(X射线、红外、超光谱和IMU)和数据挖掘(图、表格和时间序列)等广泛任务。 总的来说,Meta-Transformer展示了使用变换器开发统一多模态智能的潜力,并在不同领域中显示出多功能性和有效性。 您可以在https://github.com/invictus717/MetaTransformer 上找到Meta-Transformer的代码。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [Meta-Transformer 多模态学习统一框架](https://blog.csdn.net/m0_46510245/article/details/131992397)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [Meta-Transformer多模态学习统一框架](https://blog.csdn.net/tMb8Z9Vdm66wH68VX1/article/details/131886687)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值