MMTM: Multimodal Transfer Module for CNN Fusion

最新推荐文章于 2023-03-02 15:33:21 发布

一个小超斌

最新推荐文章于 2023-03-02 15:33:21 发布

阅读量1.5k

点赞数 1

分类专栏：多模态融合文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/baidu_41622980/article/details/109702731

版权

论文：MMTM: Multimodal Transfer Module for CNN Fusion
code:https://github.com/haamoon/mmtm

**简介：**这是一篇关于多模态融合方法的论文，多模态融合的目的就是从不同的模态中提取到互补的相关信息，从而达到比单模态更好的性能。模态融合的技术被广泛的使用到不同的深度学习任务中（视频分类、动作识别、情感识别和音频视觉语音增强等），现在的主流融合方法都是在网络最后的输出层进行融合。在这篇论文中，作者提出了一个简单的模态转换模块MMTM，可以添加到不同的特征层，使得模态之间的信息可以缓慢的融合。与其它的中间层融合方法不同，该模块可以在不同空间维度的卷积层进行特征融合。此外，该模块还可以很容易的添加到单模态网络结构中。
在这里插入图片描述
上图中，a代表早期的融合方式，在网络的首层融合；b代表后来的融合方式，在网络的尾端融合；c表示使用MMTM模块在网络的中间层进行融合。（尽管在神经学科和机器学习领域的研究认为在中间层进行特征融合更加有利于网络学习，但是在最后层融合依然是主流的融合方式，这是因为实验证明的结果）然而中间层融合需要对基础网络结构

最低0.47元/天解锁文章

一个小超斌

关注

1
点赞
踩
12

收藏

觉得还不错? 一键收藏
1
评论
MMTM: Multimodal Transfer Module for CNN Fusion

论文：MMTM: Multimodal Transfer Module for CNN Fusioncode:https://github.com/haamoon/mmtm**简介：**这是一篇关于多模态融合方法的论文，多模态融合的目的就是从不同的模态中提取到互补的相关信息，从而达到比单模态更好的性能。模态融合的技术被广泛的使用到不同的深度学习任务中（视频分类、动作识别、情感识别和音频视觉语音增强等），现在的主流融合方法都是在网络最后的输出层进行融合。在这篇论文中，作者提出了一个简单的模态转换模块MMT
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。