MTGAN: Speaker Verification through Multitasking Triplet Generative Adversarial Networks
MTGAN:通过多任务三元生成对抗性网络对说话人进行验证
摘要
在本文中,我们提出了一种增强的三元组方法,它通过联合利用生成对抗机制和多任务优化来改进嵌入的编码过程。 我们扩展了具有生成性对抗网络(GAN)和softmax丢失功能的三重编码器。 引入GAN是为了增加样本的通用性和多样性,而softmax则用于增强扬声器的功能。 为简化起见,我们将我们的方法称为多任务三元组生成对抗网络(MTGAN)。 短话语实验表明,MTGAN分别比传统的i-vector方法和最先进的三元组丢失方法将验证等错误率(EER)降低了67%(相对)和32%(相对)。 这有效地表明MT-GAN在表达说话者信息的高级特征方面优于三元组方法。
索引术语:生成对抗性网络,说话者验证,三元组丢失
1.简介