【Dual-Path-RNN-Pytorch源码分析】loss函数:SI-SNR

最新推荐文章于 2023-12-21 17:46:36 发布

安安爸Chris

最新推荐文章于 2023-12-21 17:46:36 发布

阅读量8.2k

点赞数 9

分类专栏：源码分析文章标签： pytorch rnn 深度学习

本文链接：https://blog.csdn.net/mimiduck/article/details/120239097

版权

源码分析专栏收录该内容

19 篇文章

订阅专栏

本文详细介绍了DPRNN（深度递归神经网络）所使用的损失函数——尺度不变信噪比（SI-SNR）。SI-SNR是一种衡量信号纯净度的指标，不受信号尺度变化影响。公式中，s^表示估计信号，s是纯净信号，通过计算两者之间的相关性和L2范数来评估。在源码实现中，信号先减去均值以消除平均影响。该损失函数用于训练过程中计算训练误差。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

DPRNN使用的loss函数是 SI-SNR

SI-SNR 是scale-invariant source-to-noise ratio的缩写，中文翻译为尺度不变的信噪比，意思是不受信号变化影响的信噪比

公式

公式如下：
$\begin{cases} s_{target} = \cfrac {\lang{\hat s,s}\rangle s} {||s||^2} \\ e_{noise} = \hat s - s_{target} \\ SISNR = 10 log_{10} \cfrac {||s_{target}||^2} {||e_{noise}||^2} \end{cases}$

其中 $\hat s$ 是评估信号， $s$ 是纯净信号；
$\lang{\hat s,s}\rangle$ 是元素乘积再求和运算
$s||^2$ 是L2norm(2范数)，它相当于 $\lang{s,s}\rangle$

2范数公式如下 $||x||_2= \sqrt{ \displaystyle\sum_0^nx_i^2}$ ，简单地理解它为二维空间所有点到圆心的距离

SNR是纯净信号与噪音的声强的比，而SISNR是通过正则化消减信号变化导致的影响。

在DPRNN源码中，信号s同样做了“特殊处理”，先是将s减去平均值，然后再套用公式计算。

源码如下

def sisnr(x, s, eps=1e-8):
    """
    calculate training loss
    input:
          x: separated signal, N x S tensor
          s: reference signal, N x S tensor
    Return:
          sisnr: N tensor
    """

    def l2norm(mat, keepdim=False):
        return torch.norm(mat, dim=-1, keepdim=keepdim)

    if x.shape != s.shape:
        raise RuntimeError(
            "Dimention mismatch when calculate si-snr, {} vs {}".format(
                x.shape, s.shape))
    x_zm = x - torch.mean(x, dim=-1, keepdim=True)
    s_zm = s - torch.mean(s, dim=-1, keepdim=True)
    t = torch.sum(
        x_zm * s_zm, dim=-1,
        keepdim=True) * s_zm / (l2norm(s_zm, keepdim=True)**2 + eps)
    return 20 * torch.log10(eps + l2norm(t) / (l2norm(x_zm - t) + eps))