基于原始波形的端到端DNN中避免说话人过拟合的文本无关说话人验证

31 篇文章 0 订阅
20 篇文章 1 订阅
研究提出了一种新的原始波形端到端DNN,用于文本无关的说话人验证,以解决说话人过拟合问题。通过正则化技术、多步训练和残差连接减少过拟合,提升性能。实验在VoxCeleb数据集上进行,证明了模型优于i-向量/PLDA和频谱端到端系统。
摘要由CSDN通过智能技术生成

Avoiding Speaker Overfitting in End-to-End DNNs using Raw Waveform for Text-Independent Speaker Verification

 

基于原始波形的端到端DNN中避免说话人过拟合的文本无关说话人验证

Avoiding Speaker Overfitting in End-to-End DNNs using Raw Waveform for Text-Independent Speaker Verification

摘要

 

在本研究中,我们提出一种新的原始波形端到端DNN,用于与文字无关的说话人验证。对于说话人识别,许多研究都采用说话人嵌入方案,将深层神经网络训练为说话人识别器,提取说话人特征。然而,该方案具有固有的局限性,其中训练成只对已知说话人进行分类的讲话人特征需要表示未知说

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值