语音领域评估指标学习笔记

  1. mos:
    1. 分级判断方法,采取5个级别对被测语音的质量进行评价。待测语音的质量是在所有试听人员的评分上求平均得到的。这种方式被称作平均意见得分(Mean Opinion Score, MOS)。等级分级:
    2. MOS评分有两个阶段。训练阶段,听者需要听一系列参考信号,保证大家对质量评级的标准尽可能一致;评估阶段,试听人员对所听到的信号,进行主观打分。
  2. 信噪比:
  3. 分段信噪比(时域):
    1. 首先对语音信号进行分帧,N NN为分帧的数目。需要注意,SegSNR是对所有语音帧求平均所得。该度量指标的使用,要先保证纯净语音和增强后的信号在时域上对齐,其与听者主观听觉感知有很高的关联。
  4. Perceptual Evaluation of Speech Quality: PESQ算法需要带噪的衰减信号和一个原始的参考信号,能够对客观语音质量评估提供一个主观MOS的预测值,而且可以映射到MOS刻度范围,PESQ得分范围在 -0.5–4.5 之间。得分越高表示语音质量越好。

  5. mel-cepstrum distortion(MCD):

    1. 一般来说,是作为语音合成,语音转换的客观标准,与主观的MOS相对应

    2. 可以认为MCD在8以下,能被语音识别系统识别。

    3. 计算:

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值