8Attention Based Fully Convolutional Network for Speech Emotion Recognition


前言

原文地址—2018

一、文章内容

  • 文章想法:

    • 采用全连接卷积网络进行特征提取以适应可变长度的音频数据
    • 采用迁移学习的方法提高模型精度——VGG,RESNENT复杂网络需要更多的的数据支持才能获得高的精度
    • 使用了一个2D注意力机制,不仅注意时间序列,而且注意频率方向的特征
  • 输入数据:

    • 任意尺寸的频谱数据
  • 文章模型:

    • 整体的模型流程:
      在这里插入图片描述
  • 具体模型细节:
    在这里插入图片描述

  • 训练方式:

    • 五次交叉验证
    • 只是用了排练的脚本
    • 迁移学习
    • 使用加权精度和不加权的精度来做评价指标:
    • Weighted accuracy - the overall accuracy across all utterances of the testing set.
    • Unweighted accuracy - the average of accuracies across all the classes.
  • 模型输出:

    • 分类问题
  • 实验结果:

    • 在这里插入图片描述
    • 在这里插入图片描述
  • 文章结论:

    • 模型不错

二、文章总结

  • 文章novel和优势:FCN处理任意长度的频谱,注意力层同时关注了时域和频域的信号

  • 同其他文章比较的劣势:虽然使用注意力层关注了两个维度上的特征,但是没有考虑上下文特征的影响,时序数据肯定要考虑上下环境的影响的。

三、相关代码

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不被定义的号

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值