- mos:
- 分级判断方法,采取5个级别对被测语音的质量进行评价。待测语音的质量是在所有试听人员的评分上求平均得到的。这种方式被称作平均意见得分(Mean Opinion Score, MOS)。等级分级:
- MOS评分有两个阶段。训练阶段,听者需要听一系列参考信号,保证大家对质量评级的标准尽可能一致;评估阶段,试听人员对所听到的信号,进行主观打分。
- 信噪比:
- 分段信噪比(时域):
- 首先对语音信号进行分帧,N NN为分帧的数目。需要注意,SegSNR是对所有语音帧求平均所得。该度量指标的使用,要先保证纯净语音和增强后的信号在时域上对齐,其与听者主观听觉感知有很高的关联。
-
Perceptual Evaluation of Speech Quality: PESQ算法需要带噪的衰减信号和一个原始的参考信号,能够对客观语音质量评估提供一个主观MOS的预测值,而且可以映射到MOS刻度范围,PESQ得分范围在 -0.5–4.5 之间。得分越高表示语音质量越好。
-
mel-cepstrum distortion(MCD):
-
一般来说,是作为语音合成,语音转换的客观标准,与主观的MOS相对应
-
可以认为MCD在8以下,能被语音识别系统识别。
-
计算:
-
语音领域评估指标学习笔记
最新推荐文章于 2024-05-06 11:06:54 发布