声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询 http://yqli.tech/page/data.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请注明出处。欢迎关注微信公众号:低调奋进。
Why does Self-Supervised Learning for Speech Recognition Benefit Speaker Recognition?
本文为哈尔滨工业大学和微软在2022.04.27更新的文章,主要研究无监督训练的模型对声纹识别的影响因素,具体的文章链接
https://arxiv.org/pdf/2204.12765.pdf
(本文章主要实验论证,我尽可能的写的短,让读者2分钟知道该论文做了什么,效果怎样即可)
自监督训练的模型不仅仅使语音识别系统的准确率提升,该模型同样可以使声纹识别受益。使用自监督模型进行声纹识别的架构如图1所示。为了探究自监督学习的模型如何影响声纹识别,该文章主要围绕以下三个问题进行试验总结
1, 有监督的 ASR 模型是否也可以使 声纹识别SV 任务受益吗?
2. 自监督学习SSL 对 SV 任务有什么好处?
3. SV 任务的最佳 SSL 设置是什么?