Avoiding Speaker Overfitting in End-to-End DNNs using Raw Waveform for Text-Independent Speaker Verification
基于原始波形的端到端DNN中避免说话人过拟合的文本无关说话人验证
Avoiding Speaker Overfitting in End-to-End DNNs using Raw Waveform for Text-Independent Speaker Verification
摘要
在本研究中,我们提出一种新的原始波形端到端DNN,用于与文字无关的说话人验证。对于说话人识别,许多研究都采用说话人嵌入方案,将深层神经网络训练为说话人识别器,提取说话人特征。然而,该方案具有固有的局限性,其中训练成只对已知说话人进行分类的讲话人特征需要表示未知说