基于深度学习的语音情感识别

最新推荐文章于 2024-07-14 14:26:38 发布

源码空间站11

最新推荐文章于 2024-07-14 14:26:38 发布

阅读量1.5k

点赞数 38

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/laoman456/article/details/134785522

版权

基于深度学习的语音情感识别算法，在研究之前采集相关公共语音数据集，首先通过传统语音特征提取算法，提取多种声学特征信息，然后搭建深度学习神经网络，将多种声学特征送入到网络中进行情感分类判断（至少5类以上情感），训练完成后对结果进行验证。要求深度学习或语音特征提取算法上的改进，使语音情感识别和分类效果更好，识别时间更短，准确率、召回率和综合评价函数值更高。

用到的技术：卷积神经网络（CNN）、(GUI设计)pyqt

系统结构框图：

深度学习模型，搭建的卷积神经网络

input_shape = x_train[0].shape

model = Sequential()

model.add(Conv2D(8, (13, 13),input_shape=(input_shape[0], input_shape[1], 1)))

model.add(BatchNormalization(axis=-1))

model.add(Activation('relu'))

model.add(Conv2D(8, (13, 13)))

model.add(BatchNormalization(axis=-1))

model.add(Activation('relu'))

model.add(MaxPooling2D(pool_size=(2, 1)))

model.add(Conv2D(8, (13, 13)))

model.add(BatchNormalization(axis=-1))

model.add(Activation('relu'))

model.add(Conv2D(8, (2, 2)))

model.add(BatchNormalization(axis=-1))

model.add(Activation('relu'))

model.add(MaxPooling2D(pool_size=(2, 1)))

model.add(Flatten())

model.add(Dropout(0.4))

model.add(Dense(64))

model.add(BatchNormalization())

model.add(Activation('relu'))

model.add(Dropout(0.4))

model.add(Dense(num_classes, activation='softmax'))

model.summary()

模型训练配置

model.compile(loss='categorical_crossentropy',

optimizer='adam',

metrics=['accuracy'])

model.fit(x_train, y_train, batch_size=32, epochs=1)

history = model.fit(x_train,

y_train,

batch_size=64,

epochs=50,

validation_data=(x_test, y_test))

model.save('model_1.h5')

评价指标：

（1）Precision（精度）

被正确检索的样本数与被检索到样本总数之比。即：TP / (TP + FP)；

（2）Recall（召回率）

被正确检索的样本数与被检索到的样本总数之比。即：TP / (TP + FN)；

（3）F1 score（F1分数）

F1分数是将精度和召回率组合而成的新的单一指标，用来综合考虑精度和召回率，只有当精度和召回率都很高时，才能得到较高的F1分数。

模型文件

Test目录下model.h5文件

【人工智能毕设之基于深度学习+pyqt的语音情感识别系统】 https://www.bilibili.com/video/BV1HY4y1h71i/?share_source=copy_web&vd_source=3d18b0a7b9486f50fe7f4dea4c24e2a4

源码空间站11

关注

38
点赞
踩
21

收藏

觉得还不错? 一键收藏
打赏
0
评论
基于深度学习的语音情感识别

基于深度学习的语音情感识别算法，在研究之前采集相关公共语音数据集，首先通过传统语音特征提取算法，提取多种声学特征信息，然后搭建深度学习神经网络，将多种声学特征送入到网络中进行情感分类判断（至少5类以上情感），训练完成后对结果进行验证。要求深度学习或语音特征提取算法上的改进，使语音情感识别和分类效果更好，识别时间更短，准确率、召回率和综合评价函数值更高。F1分数是将精度和召回率组合而成的新的单一指标，用来综合考虑精度和召回率，只有当精度和召回率都很高时，才能得到较高的F1分数。est目录下model。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

源码空间站11 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。