近日,在英国布莱顿举行的IEEE声学、语音及信号处理会议(ICASSP)上,中国科学技术大学语音及语言信息处理国家工程实验室智能语音团队,获得2018年IEEE信号处理学会最佳论文奖。
该论文题目为“A Regression Approach to Speech Enhancement Based on Deep NeuralNetworks”,于2015年发表于语音信号处理领域权威期刊IEEE/ACM Transactions on Audio, Speech, andLanguage Processing。论文第一作者是毕业于中国科学技术大学(以下简称“中科大”)信息学院的徐勇博士,通讯作者是中科大杜俊副教授,合作作者是中科大的戴礼荣教授和佐治亚理工学院的李锦辉教授。
该论文不同于传统的非监督的语音增强算法,提出了一种利用深度神经网络来学习带噪语音和干净语音之间复杂非线性关系的有监督语音增强算法。实验结果表明,与传统的增强算法相比,所提出的算法能够显著提高语音的主观和客观指标,并且能很好地抑制非平稳噪声。此外,论文中提出的面向高维向量映射的深度回归神经网络后续被广泛的应用于语音信号处理领域的各个方向,并在实际产品得到了很好的应用。
IEEE信号处理学会是IEEE下属主要学会之一,其颁发的最佳论文奖是信号处理领域最有影响力的国际学术奖项之一。该奖项是由IEEE信号处理学会下12个领域的技术委员会自过去五年内IEEE信号处理学会的优秀论文中依论文品质及原创性中提名,经IEEE信号处理学会奖励委员会经过激烈评选后最多提名六篇论文获得该奖项。在语音领域,这是首次以国内为第一单位发表的最佳论文奖,能获此荣誉体现了这一工作的开创性和新颖性。依据Google Scholar,该论文目前引用数目达400余次,也是ESI高被引论文(ESI Highly Cited Papers)。