有参考音质评估：基于 sisnr 的语音噪声分离

浩哥依然

已于 2024-12-24 16:47:22 修改

阅读量930

点赞数

分类专栏：笔者见解文章标签： SISNR 音质评估 PESQ 有参考语音噪声分离

于 2020-03-31 11:29:44 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wjrenxinlei/article/details/105212311

版权

笔者见解专栏收录该内容

12 篇文章

订阅专栏

本文对工作过程中遇到的音质评估问题作以记录。如有表述不当之处欢迎批评指正。欢迎任何形式的转载，但请务必注明出处。

目录

1. 引言
2. 方法
3. 注意事项
4. 举例
5. 参考文献

1. 引言

这篇文章主要想简单地谈一下评估音质的方法。对一段含噪语音降完噪之后，想评估一下其音质，最常想到的方法就是使用 pesq（perceptual evaluation of speech quality）工具对其进行打分，而计算 pesq 得分需要事先知道含噪语音中的纯干净语音成分，这种音质评估方法就称为有参考音质评估。

2. 方法

而降完噪之后的信号其实包含两部分：语音成分和噪声成分, 如何单独评估降噪算法对干净语音的失真以及对噪声的降噪量那。当然，需要先从降完噪之后的信号中分离出语音成分和噪声成分，下面介绍一种简单的分离方法：
$\vec{\hat{s}}_{clean}=\frac{\lt\vec{s}_{denoised},\vec{s}_{clean}\gt\vec{s}_{clean}}{||\vec{s}_{clean}||^{2}}$

其中，

$\vec{s}_{denoised}$ ：表示降完噪的信号
$\vec{\hat{s}}_{clean}$ ：表示降完噪信号中的语音成分
$\vec{s}_{clean}$ ：表示事先知道的含噪语音中的纯干净语音成分
$\lt\vec{a},\vec{b}\gt$ ：表示 $\vec{a}$ 和 $\vec{b}$ 的点积操作
$||\vec{a}||^{2}$ ：表示 $\vec{a}$ 的 2 范数的平方

这种做法的思想是将降完噪之后的信号投影到干净语音上。分离出降完噪信号中的语音成分和噪声成分后就能进一步估计降噪算法对语音的失真以及对噪声的降噪量了，上述公式其实就是计算 SISNR 的公式。

3. 注意事项

在具体实现的过程中需要注意以下两点：

在计算投影因子 $\frac{<\vec{s}_{denoised},\vec{s}_{clean}>}{||\vec{s}_{clean}||^{2}}$ 的时候可以（如每帧 30ms）计算；
在计算上述公式中分子的时候， $\vec{s}_{denoised}$ 和 $\vec{s}_{clean}$ 必须对齐，两者之间尽可能不存在延迟。

4. 举例

下面给个例子看一下分离效果：
图1 降噪之后的信号

图 1 降噪之后的信号
图2 分离出的干净语音

图2 分离出的干净语音

图 2 分离出的干净语音

图3 分离出的残留噪声

图 3 分离出的残留噪声

5. 参考文献

[1] Vincent E , Gribonval R , Fevotte C . Performance measurement in blind audio source separation[J]. IEEE Transactions on Audio, Speech and Language Processing, 2006, 14(4):1462-1469.

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。