语音情感识别
正经的曹同学
这个作者很懒,什么都没留下…
展开
-
语音情感识别研究现状
语音情感识别研究现状情感是什么语音情感识别是什么为什么要研究语音情感识别语音情感识别方法语音情感识别未来趋势情感是什么情感是什么:按照当前心理学研究表示为情绪,或者是感觉的体现。这些都是抽象的虚拟的无法作为具体的表现,是一种充满主观性质的内容。语音情感识别是什么语音情感识别是将语音作为识别情感的依据,因为语音当中包含很多语音情感的表现,类似于语速:代表着说话的快慢,重口音,以及音高基频等韵律相关的特征,当然也有mel-倒谱系数这样的同样可以作为判断情感的识别因素,所以语音情感识别能够将语音当中包含的原创 2022-05-02 18:13:48 · 3047 阅读 · 0 评论 -
EMO-DB 数据集的 Speech 特征提取
EMO-DB 数据集的 Speech 特征提取数据集介绍提取相关特征总结数据集介绍- EMO-DB数据集是由柏林工业大学录制的德语情感语音库- 535条语音文件(一共有十名演员其中五男五女)其中语句内容包含日常生活用语的5个短句和5个长句,具有较高情感自由度,不包含某一特定情感倾向。采用16kHZ采样,16bit量化,并以WAV格式保存文件。- 其中情绪组成:anger, neutral, fear, boredom, happiness, sadness, disgust.主要是用到这个语音标原创 2022-04-21 10:25:41 · 1308 阅读 · 3 评论 -
KNN GMM语音情感识别(IEMOCAP)
def GMM(): data_mfcc,data_label = IEMPCAP_dataset.ge_dataset() print(len(data_mfcc),":",len(data_label)) # GMM模型 K = 4 gmm = GMM(data_mfcc,K) gmm.GMM_EM() y_pre = gmm.prediction print("GMM预测结果:\n",y_pre) print("GMM正确率为:\原创 2022-04-12 14:37:23 · 4477 阅读 · 0 评论 -
SVM分类语音情感识别(IEMOCAP)
数据加载数据提取方式,利用前面的文章,提取MFCC,作为特征结果,并且取定长的语音长度为特征,保证输入的长度一致如果需要提取不定长度的可以直接使用PS 或者其他工具直接提取MFCC这里提到一下,time=300意味着,是300帧,也就是定长3s+15ms的长度 一帧的帧移动是10ms 也就是10*300+25-10def mfcc_extract(file_name): data, time, rate = mfcc_read_file(filename=file_name) #提原创 2022-04-12 14:28:56 · 4883 阅读 · 8 评论 -
Opensmile提取相关的语音特征
import osimport numpy as npimport csvfrom util import util_extract# 每个特征集的特征数量FEATURE_NUM = { 'IS09_emotion': 384, 'IS10_paraling': 1582, 'IS11_speaker_state': 4368, 'IS12_speaker_trait': 6125, 'IS13_ComParE': 6373, 'ComParE_2原创 2022-03-31 16:14:52 · 1085 阅读 · 4 评论 -
AN INTERACTION-AWARE ATTENTION NETWORK FOR SPEECH EMOTION RECOGNITION IN SPOKEN DIALOGS -情感识别论文学习
语音情感识别论文学习分享原创 2022-01-12 09:16:01 · 385 阅读 · 0 评论 -
INTERACTION AND TRANSITION MODEL FOR SPEECH EMOTION RECOGNITION IN DIALOGUE 语音情感识别(对话级别的论文)
Interaction and Transition Model for Speech Emotion Recognition in Dialogue 简单介绍论文结构总结简单介绍作者、单位:这篇文章简单介绍一下,本来语音情感识别的对象都是sentence 而不是dialogue,相比而言,就不需要知道上下文的相关信息,而大部分的数据库的标注都是有分开也有放在一起的,比较知名的数据库IEMOCAP就是既有对话也有短句,这篇文章的目的就是基于对话级别的来进行判断连续对话的情感识别,因为之前我也讲过,连续原创 2021-12-08 21:38:43 · 501 阅读 · 0 评论 -
IEMOCAP-数据集文件预处理
import osimport globimport waveimport python_speech_features as psimport numpy as npimport pickledef read_wavefile(filename): #开始读取wav文件 file = wave.open(filename,'r') params = file.getparams() #获取得到的所有参数 n_channels, samp_with, fram_r原创 2021-11-29 12:24:23 · 7662 阅读 · 25 评论