多模态的个性识别分析总结

前言

上周我阅读了4篇关于多模态的个性分析论文,其实这些多么他的个性论文和多模态的情感分析都是一个道理,都是通过多个模态来进行分类,这是我的4篇论文的阅读笔记地址。

个性分析综述地址:

总结

这4篇个性分析论文都是使用三个模态,他们的整个模型框架大致相似, 如下:

在这里插入图片描述
对于三模态, 视频, 语音, 文本 一般的处理步骤如下

对于video

对于video为两种做法

  • 只对画面进行提取 使用过 Open FaceVGG-16的预训练模型
  • 对视频进行提取 使用过: 3D-CNN + LSTM

对于text使用过:

  • word2vec + CNN
  • SentiWordNet 情感词标记 不是深度学习方法
  • CNN + LSTM

对于audio 使用过

  • MFCC特征 (较为死板, 人为制定的)
  • openSmile
  • 多层的CNN

对于特征提取

  • 层次化特征融合 LSTM
  • 多层神经感知网络 +权重
  • 全连接层 连接三个模态得到的特征, 包括固定特征提取的网络参数, 和不固定特征提取的网络参数

总结

  • 对于多模态的视频和语音方面的特征提取,这些方面我并不是很了解,到现在应该会有一些比较新的方法,所以我需要去找一些这些新的方法,找到他们的改进空间。

  • 对于文本方向的特征提取,应该可以使用一些最新的模型来提高结果,例如BERT,等, 例如 在Multimodal Categorization of Crisis Events in Social Media 里面其实用到了BERT,上层加入Attention, 提升结果, 而图像方面用一些经典的方法 DenseNet ResNet等等,应该可以提升效果

在这里插入图片描述

  • 4
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值