Pytorch搭建DTLN降噪算法

前面介绍了几种轻量级网路结构的降噪做法,本文介绍DTLN—一种时频双核心网络降噪做法。

AI-GruNet降噪算法

AI-CGNet降噪算法

AI-FGNet降噪算法

Pytorch搭建实虚部重建AI-GruNet降噪算法


一、模型结构

DTLN来自[2005.07551] Dual-Signal Transformation LSTM Network for Real-Time Noise Suppression (arxiv.org),主要由两个时频网络组成,在频域以及时域同时进行建模去噪,效果可观,计算量可控。

特征方面,使用的是对数功率谱。

网络方面,首先是频域核心网络,类似AI-GruNet:先进行短时归一化,这个归一化不同其他norm层,是帧内归一化, 然后经过一个rnn核心网络,最后预测理想比率掩码,对幅度谱实现降噪。

其次是时域核心网络,主要包括编码层、rnn核心层和解码层,其中编码解码通过一维卷积实现。先将频域核心网络增强后的频谱转到时域,然后通过编码层提取高维特征表示,然后经过第二个rnn核心网络预测时域掩码作用到高维特征, 最后通过解码层解码完成时域降噪。

图片

前向代码:

图片

相比之前的频域网络降噪做法,DTLN同时对时域和频域进行建模降噪处理,隐式包含了相位信息,建模更全面,效果会更稳定。

二、测试数据和处理结果

鼠标噪声测试效果,整体降噪效果非常明显,噪声段降噪30多db:

DTLN_MouseClicks_processed,算法晓记,10秒 

DTLN_MouseClicks_orig,算法晓记,10秒 

图片

无法张贴测试音频,更多测试音频和下载链接,见微信公众号“算法晓记”文章 Pytorch搭建DTLN降噪算法

三、代码

包括训练代码和工程代码,后续考虑公开。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
基于PyTorch的图像分类算法是一种利用深度学习框架PyTorch来实现图像分类任务的算法PyTorch 是一个开源的机器学习框架,旨在为研究人员和开发者提供灵活且直观的深度学习工具。它使用动态计算图的方式来构建神经网络模型,使得模型的构建和调试更加灵活和高效。PyTorch 的设计理念是"Define by Run",即通过运行来定义模型的计算图结构,这与其他框架如TensorFlow的"Define and Run"不同,使得模型构建更加直观简洁。 图像分类是计算机视觉中的一项重要任务,其目标是将输入的图像分为不同的类别。基于PyTorch的图像分类算法通常涉及以下几个步骤: 1. 数据预处理:将输入的图像进行预处理,包括图像的缩放、剪裁、增强等操作。这些操作可以通过PyTorch中的transforms模块来实现。 2. 构建模型:使用PyTorch定义深度学习模型,通常包括卷积神经网络(Convolutional Neural Network, CNN)的搭建PyTorch提供了丰富的模型组件和层,可以根据需求来自定义模型结构。 3. 模型训练:通过定义损失函数和优化算法,对模型进行训练。PyTorch提供了各种损失函数和优化算法的实现,如交叉熵损失函数和随机梯度下降优化算法。 4. 模型评估:使用训练好的模型对测试集进行预测,计算预测结果与真实标签之间的准确率等指标来评估模型的性能。 5. 模型优化:根据评估结果进行模型优化,可以通过调整超参数、改变模型结构等方式来提高分类性能。 总之,基于PyTorch的图像分类算法提供了一个灵活和高效的深度学习工具,使得图像分类任务的实现更加简单和便捷。通过使用PyTorch的模块和函数,可以快速搭建和训练一个功能强大的图像分类模型
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值