项目的模型使用双循环神经网络(RNN)对音频和文本序列中的信息进行编码,然后结合这些信息源中的信息来预测情感类。应用IEMOCAP数据集的时候,提出的模型将数据分配给四种情绪类别(即愤怒,快乐,悲伤和中性)中的一种方面优于以前的最先进方法,精度从68.8%到71.8%不等。
项目需求
需求
tensorflow1.4
python3.7
scikit-learn0.20.0
nltk3.3
这四个是必须的,然后还有其它的库请看截图=.=
首先这个项目是用python2.7写的,然后我也就在电脑上把python2.7.13和python3.7都安装了,适配进pycharm。然后坑的是tensorflow目前不支持python3以下的版本(oh my god!!!),于是乎,我就开始将python3.7作为版本号,然后开始了漫长的将python2.7的语法写的代码修改为适用于python3.7的代码(ps:据说官方打算在2020年一月份停止更新python2.7,所以捏,还停留在python2.7的小伙伴们赶紧,麻溜滴将版本号切换至python3以上的吧=^=!(老项目除外))。处理完这个之后,就开始安装各种库了(numpy,scipy,nltk,scikit-learn==0.20.0等等)。Pycharm有个好处就是:它可以直接在Pycharm软件里面添加各种库(那可是灰常方便的呀,比起在控制台用pip或者conda命令安装库方便多
《基于音频和文本的多模态语音情感识别的TensorFlow实现》的项目(写的很人性化的哦!)
最新推荐文章于 2024-08-19 10:07:04 发布