多模态融合相关概念

不想敲代码的小杨

于 2022-11-02 17:34:21 发布

阅读量6.1k

点赞数 3

分类专栏：深度学习基础知识文章标签：人工智能计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43921949/article/details/127610345

版权

目录

多模态融合方法

模型无关的融合方法

基于模型的融合策略

多模态对齐方法

综述：A review: Deep learning for medical image segmentation using multi-modality fusion

多模态医学图像分割

多模态分割网络

输入级融合网络

层级融合策略（分层融合）

决策级融合

深度学习中的多模态融合技术是模型在分析和识别任务时处理不同形式数据的过程。

多模态融合技术主要包括模态表示，融合，转换，对齐技术。多模态融合技术的主要目标是缩小语义子空间中的分布差异，同时保持模态特定语义的完整性。

多模态融合架构分为联合架构，协同架构和编解码器架构。1）联合架构是将单模态表示投影到一个共享的语义子空间中，以便能够融合多模态特征 2）协同结构包括跨模态相似性模型和典型相关分析，其目标是寻找协调子空间中模态间的关联关系。 3）编解码器架构是将一个模态映射到另一个模态的多模态转换任务中

编解码器结构

这种结构主要由编码器和解码器两部分组成。编码器将源模态映射到向量V中，解码器基于向量V生成一个新的目标模态样本。

目前，编解码器结构重点关注的是共享语义捕获和多模序列的编解码问题，为有效捕获源模态和目标模态两种模态的共享语义。，主流的解决方案是通过一些正则化术语保持模态之间的语义一致性，需确保编码器能正确检测和编码信息，而解码器能推理高级语义和生成语法，以保证源模态中语义的正确理解和目标模态中新样本的生成。

多模态融合方法

多模态的融合方法分为模型无关的方法和基于模型的方法，前者不直接依赖于特定的深度学习方法，后者利用深度学习模型显式的解决多模态融合问题

模型无关的融合方法

模型无关的融合方法可以分为早期融合（基于特征），晚期融合（基于决策）和混合融合策略，早期融合在提取特征后立即集成特征，晚期融合在每种模态输出结果后才执行集成。混合融合结合早期融合方法和单模态预测器的输出。

当模态之间的相关性较大时晚期融合优于早期融合，当各个模态在很大程度上不相关时采用晚期融合的方法则更合适。混合融合策略在综合了二者的优点的同时也增加了模型的结构复杂度和训练难度。

综上，三种融合方法各有缺点，早期融合能比较好的捕获特征之间的关系，但容易过拟合。晚期融合能够较好的处理过拟合问题，但不允许分类器同时训练所有的数据。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。