【无标题】

多模态情感分析的难点:模态之间如何更好的融合?多模态特征的信息冗余
以语音+文本(双模态)为例,语音模态可以提供音色特征来辅助情感分析任务,接下来就是将语音特征和文本特征融合,来生成更好的句子表示,更好的句子表示可以提高分类精确度。
目前主流的解决方案是动态融合两种特征,使用注意力机制,大多数成果都是对注意力的花式改进。
设计一种新的注意力机制,可以参考机器翻译领域对注意力改进的一些技术,新的注意力机制可以融合两种模态,还能解决信息冗余问题或者其他的问题。
师哥的改进:多步交互注意力机制,让两种模态一块不断做注意力操作,逐步分离出最重要的信息,类似于蒸馏操作。
在这里插入图片描述

目前多模态领域的最好模型:让两种模态分别做注意力操作,先分离出各自模态的重要信息,然后在拼接这些重要的信息。
两种方式都是对注意力机制进行调整
在这里插入图片描述

技术路线:
和上面两种方式类似,文本方面用Bert进行编码,音频方面用BiGRU进行编码,设计新的注意力机制来融合两种模态,并且通过该注意力机制动态选择出对分类最有用的局部信息,解决信息冗余问题或其他问题。

由于Bert是预训练模型,产生的词向量非常好,但是其他模态的表征可能并不好,可以使用对比学习的方式来增强其他模态的句子表示。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

石头猿rock

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值