目录
Abstract
- 愤怒、恐惧、喜悦和悲伤情绪的声音表达与中性言语的关系
- 针对汉语语音信号中带有情绪唤起的词重音进行研究
Introduction
- 汉语愤怒、恐惧、喜悦和悲伤的声学实现有两个维度,即语音和韵律
- 首先分析了声学特征,包括持续时间、短时振幅和音高,不仅在句子层面,而且在单词层面。第二,将检验两个水平之间的比较结果。第三,我们分析了普通话情感话语中的重音。
Emotional speech sample
Acoustic Analysis
Duration
- 句子和单词长度被选为持续时间特征
-
L
R
S
LRS
LRS定义为在中性状态下,情绪句长(sec)与同一句话长之比的向量
-
L
R
W
LRW
LRW情绪词长(sec)与中性状态下相同词长之比的向量
Short-time Amplitude(短时幅度)
- A R S ARS ARS情绪句幅值与相应的中性句幅值之比
- A R W ARW ARW情绪词幅值与相同的中性句幅值之比
Pitch (F0)
- F R S FRS FRS情绪句与相应中性句的F0比向量
- F R W FRW FRW情绪词与相同中性句的F0比向量
Feature Changes of “Word Stress” with Emotion(“词重音”随情绪变化的特征)
- Anger:
具有较高的振幅和F0值。单词重音对于愤怒情绪是明显的。能量最高的重音词也有可能具有最大的F0均值,其F0在高频空间中保持,而持续时间不能成功地确定重音。 - Fear:
较高的F0值是通过感知来决定单词重音的主要声学相关因素,其次是较高的振幅。 - Joy:
和Fear一样。 - Sadness:
表示悲伤的单词重音并不明显。较宽的f0范围和较长的单词长度是通过感知确定单词重音时需要考虑的声学相关因素。