3.High-level Feature Representation using Recurrent Neural Network for Speech Emotion Recognition

最新推荐文章于 2021-12-04 15:59:19 发布

不被定义的号

最新推荐文章于 2021-12-04 15:59:19 发布

阅读量281

点赞数

文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/qq_37771209/article/details/115375996

版权

前言

文章先总结了使用神经网络进行感情识别工作的不足（以前的工作主要是对这篇论文Speech Emotion Recognition Using Deep Neural Network and Extreme Learning Machine），然后提出了改进措施
这个文章在长期的上下文效应和情绪标签对语音内部情绪表达的不确定（就是一句话整体的含义标签是固定的，但是这句话内部可能存在和这个感情标签不同的感情状态）性两个方面提出了相应的解决办法，模型的整体架构如下。
针对上下文效应采用了BLSTM模型对帧级别的序列特征进行建模，不用拼接了。充分的在高层的特征表达上融合了上下文信息
同时提出一种方法可以是模型更关注与感情有关的帧，类似与注意力机制
实验结果如下，提高到了60%了

关注