多模态学习入门和实践

最新推荐文章于 2025-03-06 09:53:45 发布

Neways谭

最新推荐文章于 2025-03-06 09:53:45 发布

阅读量2.6k

点赞数 1

分类专栏：多模态 NLP 文章标签：人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46195663/article/details/111278033

版权

本文介绍了多模态学习的基本概念，包括Representation、对齐、翻译和融合等主要任务。重点讨论了如何通过多模态数据的互补性和协同学习来提升模型性能，并提到了对齐和融合的挑战，如模态间相关性的判断和非同步数据的配准。此外，还提及了协同学习如何利用丰富资源模态辅助学习。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

多模态学习

概念
- 主要任务

概念

模态(Modality) 事物发生的方式

主要任务

Representation

学习将多模态数据整合到一个特征表示中。其中，通过利用多模态之间的互补性，剔除模态间的冗余性，从而学习到更好的特征表示。（如下例子）
在这里插入图片描述
展现方式主要如下：
joint联合在一个展现空间中
coordinated，不同模态展现在不同空间中，但空间之间相互约束

对齐

将多模态的元素对齐
在这里插入图片描述

翻译

将某种模态的数据转化成另一种模态
在这里插入图片描述

最低0.47元/天解锁文章

博客等级

码龄5年

23
原创

10
点赞

93
收藏

12
粉丝

关注

私信

热门文章

分类专栏

最新评论

Transformer
Neways谭: 作者调试出来的，具体代码里应用有相对简化，可以去翻下开源的代码
Transformer
Neways谭: transformer里用到了相似度计算（你觉得这篇文章有展示），是scaled-dot product，这个在我这篇文章里有说明，可以仔细看下。
Transformer
lmw0320: 另外，真的不明白，这里搞个位置编码，用个三角函数，还要做成如此复杂。。我实在不知道这种公式，是如何弄出来的。。。
Transformer
lmw0320: 为什么我看百度的一篇关于Transformer的文章:https://blog.csdn.net/longxinchen_ml/article/details/86533005, 里面根本没提到这个相似度计算的问题？
高效文本分类工具：fastText
不正经的kimol君: 写的不错，学习了，学习的道路上一起进步，也期待你的关注与支持！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。