多模态特征融合方法调研
Jeff Dean: 我认为,在多任务学习和多模态学习方面会有很大进展,解决更多的问题。我觉得那会很有趣。
多模态学习被越来越多地应用于深度学习,尤其是在医学影像方面,对于同一个病症的不同诊断方式为医生提供了多角度的参考。基于深度学习的医学影像处理也呈现出多模态的发展趋势,而如何合理地利用和融合不同模态的特征是一个重要的问题。此调研整理了这篇博客在Fusion方面的思路。
目录
多模态融合的总体思路
TFN和LMF
基于attention的fusion
(一)多模态融合的总体思路
多模态的特征融合方法总体上可以分为像素级、特征级和决策级。其中特征级别的融合是研究的重点。决策级别的融合(如voting)常常作为比赛刷榜的trick,有稳定的效果但提升的空间有限。
(二)TFN和LMF
TFN
该方法在Tensor Fusion Network for Multimodal Sentiment Analysis中被提出,用于情感分类的任务。
考虑一个情感分类的问题