【个人总结】基于深度学习的语音分离代码及论文

小欧尼思密达

已于 2022-06-14 10:10:20 修改

阅读量4.2k

点赞数 11

分类专栏：深度学习信号处理网络文章标签：深度学习语音识别 python

于 2022-06-10 10:35:49 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42853410/article/details/125216196

版权

信号处理同时被 3 个专栏收录

9 篇文章 33 订阅

订阅专栏

8 篇文章 6 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

项目和资料汇总

一、语音分离发展历程

二、语音数据集处理

拟采用matlab生成wav数据集，然后使用python进行wav文件的读取和处理

三、语音分离评价指标

四、基于深度学习的语音分离（从网络角度及通道数划分）

1. 基于DPRNN的语音分离

【代码git】Dual-Path-RNN-Pytorch
【文章】Dual-Path RNN: Efficient Long Sequence Modeling for Time-Domain Single-Channel Speech Separation
【论文翻译】
【网络解析】
【网络解析2.0】
【论文总结】
【loss解析–SISNR】

2. 基于深度聚类的语音分离

【文章】深度聚类用于语音分离
Deep clustering: Discriminative embeddings for segmentation and separation
【代码git】基于深度聚类的语音增强1
包括scp文件处理代码（用于自己数据集的处理）
【代码git】基于深度的聚类语音增强2
包括scp具体是什么文件的介绍（用于自己数据集的处理）
【代码git】分离的评价指标——sdr

3. 基于transformer的语音分离

【代码git】基于Conformer的语音分离
可下载LibriCSS dataset数据集
【文章】transformer用于语音分离
ATTENTION IS ALL YOU NEED IN SPEECH SEPARATION

4. 基于各种变化网络的语音分离

5、多通道的语音分离

【文章及代码】多通道窄带深度语音分离
 【代码git】多通道窄带深度语音分离
 【文章1】Multi-channel Narrow-band Deep Speech Separation with Full-band Permutation Invariant Training
【文章2】Multichannel Speech Separation with Narrow-band Conformer

五、第三方语音处理工具包

【工具包】Source Seperation
一个用于语音增强&分离&去噪的工具包

六、数据集网站

七、网站回答补充

SpEx+：一个完整的时域说话人提取网络

小欧尼思密达

关注

11
点赞
踩
99

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。