![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文翻译
文章平均质量分 91
我和代码有个约会.
好好学习!
展开
-
DIFFERENTIABLE CONSISTENCY CONSTRAINTS FOR IMPROVED DEEP SPEECH ENHANCEMENT -- 论文翻译
用于改进深度语音增强的可区分一致性约束作者: Scott Wisdom, John R. Hershey, Kevin Wilson, Jeremy Thorpe,Michael Chinen, Brian Patton, Rif A. Saurous Google Research摘要 近年来,深度网络通过将其作为一个数据驱动的模式识别问题,导致了语音增强方面的巨大改进。在许多现代增强系统中,大量的数据被用来训练一个深度网络,以估计复值短时傅里叶变换(STFT)的掩码,以抑制噪声和保留语音。然而,翻译 2021-08-28 10:07:58 · 332 阅读 · 0 评论 -
WAVE-U-NET: A MULTI-SCALE NEURAL NETWORK FOR END-TO-END AUDIO SOURCE SEPARATION-----论文翻译
WAVE-U-NET: 一个用于端到端音源分离的多尺度神经网络作者:Daniel Stoller、Sebastian Ewert、Simon Dixon摘要: 音频源分离模型通常在幅度频谱上操作,这忽略了相位信息,使分离性能依赖于频谱前端的超参数。因此,我们研究了时域中的端到端声源分离,它允许对相位信息进行建模,并避免了固定的频谱转换。由于音频的高采样率,在采样水平上采用长时间的输入背景是困难的,但由于长距离的时间相关性,需要高质量的分离结果。在这种情况下,我们提出了Wave-U-Net,它是U-N翻译 2021-08-05 09:38:11 · 2133 阅读 · 0 评论 -
Complex Spectral Mapping With Attention Based Convolution Recurrent Neural Network(省略)---论文翻译
基于注意力的卷积递归神经网络的复杂频谱映射,用于语音增强Liming Zhou1, Yongyu Gao1,Ziluo Wang1,Jiwei Li1,Wenbin Zhang11CloudWalk Technology Co., Ltd., Shanghai, China 1fzhouliming,gaoyongyu,wangziluo,lijiwei,zhangwenbing@cloudwalk.cn摘要语音增强已经从深度学习在可懂度和感知质量方面的成功中获益。传统的时频(TF)域方法侧重于通过天翻译 2021-07-21 09:42:16 · 1461 阅读 · 0 评论 -
DPCRN: Dual-Path Convolution Recurrent Network for Single Channel Speech Enhancement---论文翻译
DPCRN:用于单通道语音增强的双路径卷积递归网络Xiaohuai Le1;2;3, Hongsheng Chen1;2;3, Kai Chen1;2;3, Jing Lu1;2;31Key Laboratory of Modern Acoustics, Nanjing University, Nanjing 210093, China 2NJU-Horizon Intelligent Audio Lab, Horizon Robotics, Beijing 100094, China 3Nanjing翻译 2021-07-21 09:21:25 · 6115 阅读 · 2 评论 -
A Convolutional Recurrent Neural Network for Real-Time Speech Enhancement---论文翻译
用于实时语音增强的卷积递归神经网络作者:Ke Tan1, DeLiang Wang1,21Department of Computer Science and Engineering, The Ohio State University, USA2Center for Cognitive and Brain Sciences, The Ohio State University, USA摘要许多现实世界中的语音增强应用,如助听器和人工耳蜗,都需要实时处理,没有延迟或低延迟。在本文中,我们提出了一种翻译 2021-07-15 22:40:27 · 1000 阅读 · 0 评论 -
Learning Complex Spectral Mapping With Gated Convolutional---论文翻译
用门控的复杂频谱映射学习 复杂频谱映射的学习 单声道语音增强作者: Ke Tan , Student Member, IEEE, and DeLiang Wang , Fellow, IEEE摘要:相位对于语音的感知质量很重要。 然而,通过监督学习直接估计相位谱似乎很困难 由于其中缺乏频谱时间结构,通过监督学习直接估计相位谱似乎很难。复杂频谱映射的目的是估计 复杂频谱映射的目的是估计干净语音的实谱和虚谱,从那些 噪声语音的实谱和虚谱,这同时增强了语音的幅值和 语音的相位响应。受多任务学习的启发,我们翻译 2021-07-15 22:11:50 · 1190 阅读 · 0 评论