《基于音频和文本的多模态语音情感识别的TensorFlow实现》的项目(写的很人性化的哦！)

最新推荐文章于 2024-08-19 10:07:04 发布

醒了的追梦人

最新推荐文章于 2024-08-19 10:07:04 发布

阅读量3.9k

点赞数 4

分类专栏：机器学习and深度学习 Python 文章标签：音频文本多模态语音情感识别 TensorFlow

本文链接：https://blog.csdn.net/qq_33472146/article/details/90668194

版权

项目的模型使用双循环神经网络（RNN）对音频和文本序列中的信息进行编码，然后结合这些信息源中的信息来预测情感类。应用IEMOCAP数据集的时候，提出的模型将数据分配给四种情绪类别（即愤怒，快乐，悲伤和中性）中的一种方面优于以前的最先进方法，精度从68.8%到71.8%不等。
项目需求
需求
tensorflow1.4
python3.7
scikit-learn0.20.0
nltk3.3
这四个是必须的，然后还有其它的库请看截图=.=
在这里插入图片描述
首先这个项目是用python2.7写的，然后我也就在电脑上把python2.7.13和python3.7都安装了，适配进pycharm。然后坑的是tensorflow目前不支持python3以下的版本(oh my god!!!)，于是乎，我就开始将python3.7作为版本号，然后开始了漫长的将python2.7的语法写的代码修改为适用于python3.7的代码(ps:据说官方打算在2020年一月份停止更新python2.7，所以捏，还停留在python2.7的小伙伴们赶紧，麻溜滴将版本号切换至python3以上的吧=^=!（老项目除外）)。处理完这个之后，就开始安装各种库了(numpy,scipy,nltk,scikit-learn==0.20.0等等)。Pycharm有个好处就是：它可以直接在Pycharm软件里面添加各种库(那可是灰常方便的呀，比起在控制台用pip或者conda命令安装库方便多