语音领域评估指标学习笔记

最新推荐文章于 2023-04-24 17:45:49 发布

Wsyoneself

最新推荐文章于 2023-04-24 17:45:49 发布

阅读量979

点赞数 2

分类专栏： speech 文章标签： ui

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45647721/article/details/129689642

版权

speech 专栏收录该内容

23 篇文章 8 订阅

订阅专栏

mos：
1. 分级判断方法，采取５个级别对被测语音的质量进行评价。待测语音的质量是在所有试听人员的评分上求平均得到的。这种方式被称作平均意见得分（Mean Opinion Score, MOS）。等级分级：
2. MOS评分有两个阶段。训练阶段，听者需要听一系列参考信号，保证大家对质量评级的标准尽可能一致；评估阶段，试听人员对所听到的信号，进行主观打分。
信噪比：
分段信噪比（时域）：
1. 首先对语音信号进行分帧，N NN为分帧的数目。需要注意，SegSNR是对所有语音帧求平均所得。该度量指标的使用，要先保证纯净语音和增强后的信号在时域上对齐，其与听者主观听觉感知有很高的关联。
Perceptual Evaluation of Speech Quality: PESQ算法需要带噪的衰减信号和一个原始的参考信号，能够对客观语音质量评估提供一个主观MOS的预测值，而且可以映射到MOS刻度范围，PESQ得分范围在 -0.5–4.5 之间。得分越高表示语音质量越好。
mel-cepstrum distortion（MCD）：
1. 一般来说，是作为语音合成，语音转换的客观标准，与主观的MOS相对应
2. 可以认为MCD在8以下，能被语音识别系统识别。
3. 计算：

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
语音领域评估指标学习笔记

语音领域评估指标学习笔记
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。