百度发表的论文
《Deep Speaker: an End-to-End Neural Speaker Embedding System》
谷歌近几年发表几篇经典声纹识别文章
《Speaker Diarization with LSTM》
《Generalized End-to-End Loss for Speaker Verification》 比百度论文好
声纹识别可以借用人脸识别的三元组技术
微软
《Attention-Based Models for Text-Dependent Speaker Verification》用到了 注意力机制 (权重机制)NLP里的
注意力机制必须用到文本相关
《Text-Independent Speaker Verification Using 3D Convolutional Neural Networks》