笔记 --(2004)语音信号 中的情感特征分析和识别的研究
论文题目:语音信号 中的情感特征分析和识别的研究
作者:赵 力 ’ , 2 , 将春辉 , , 2 , 邹采 荣, , 吴 镇扬`
摘要
提出了一种利用全局和 时序结构的组合特征以及 M M D 进行情感特征识别的方法 .对于从 拍 名话者中 搜集的带有欢快 ,愤怒, 惊奇和悲伤 4 种情感的 1以又) 句语句 , 利用提出的新的识别方法获得 了 抖% 的平均 情感识别 率 .
介绍
本文研究 了语音信号 中情 感特征分析和识别的问题 . 针 对含有欢快、 愤怒、 惊奇、 悲伤等 4 种情感的语音信号 ,分析了 它们的时 间构造、 振幅构造、 基频构造和共振峰构造 的特征 , 并通过和不带感情的平静语音信号进行 比较, 总结了不 同情 感信号特征的分布规律。根据这些分析 ,利用整个句子 的全局特征和不同区段的时序韵律特征 的组合进行了情感识 别实验 . 针对特征维数的增加 ,还提出了一种新的修改型马氏 距离判别式( M MD )。
数据集
选用了 60 个语句作为情感分析用语音资料 . 本文把情感类 型粗略划分 为欢快 , 愤怒 , 惊奇 , 悲伤等 4 种 , 并尽可 能将通常 认为的所有情感纳人此分类中。原始的语音数据 , 我们让 10 名善于表演的男性话者对 印 个语句用欢快 , 愤怒 , 惊 奇, 悲伤等 4 种情感各发音 1 遍 , 同时再让每位话者用 不带感 情的尽可能平静的方式将每一语句各发音 1 遍 , 这样共搜集 到 3000 个实验用语句(2000用于训练,1000用于识别)。为了检验所搜集的实验用情 感语音数据的有效性 , 我们做了一个听取实验 . 我们要求以上 10 名发音者以外的另 5 名实验者坐在 电脑终端前 , 随机播放,所搜集到的带有各种情感的语句 , 让实验者通过主观评价说出所放语音的情感类型 . 经过 反复