Incomplete Multimodal Learning（不完整多模态学习）

最新推荐文章于 2025-03-14 19:05:41 发布

上杉翔二

最新推荐文章于 2025-03-14 19:05:41 发布

阅读量1.4w

点赞数 28

分类专栏：深度学习多媒体和多模态文章标签：多模态学习 multi-modal 表示学习缺失模态前沿论文

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39388410/article/details/124575569

版权

博主已经更新过很多多模态系列的文章了，专栏传送门：多媒体与多模态专栏。

可以发现多模态虽然效果很好，但需要保证“多个”模态都一定要存在。但是在现实世界中，部分模态的缺失是很常见的，因此不完整/缺失多模态学习（Incomplete Multimodal Learning）任务也十分值得探索。本篇博文将整理这一研究方向中一些不错的文章。

在这里插入图片描述
Unified subspace learning for incomplete and unlabeled multi-view data
比较早期的文章，任务是跨模态检索或多模态聚类，主要存在两个问题：

不完整。模态数据往往是不完整的，即一些样本的特征集不完整。
无标记。由于人工标注的成本很高，大多数数据都没有标记。

因此，作者针对不完整和未标记的挑战提出了一种新颖的子空间学习框架。该模型直接优化了类指标矩阵（class indicator matrix），为不完整的特征集建立了桥梁。具体来说，该模型综合考虑了特征选择、模态间和模态内的相似性保持，用以增强子空间学习。

模型图如上所示，对于不完整的文本和图像模态，会先使用投影矩阵将原始特征投影到类指示符矩阵（class indicator matrix）中，该类指示符矩阵显式地捕获了聚类结构，并充当了潜在空间。 $l((X'^{(g)},U_{(g)}),Y'^{(g)})=||[X^{(g)}_C,X'^{(g)}]^TU_{(g)}-[Y^C;Y'^{(g)}]||^2_F$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。