做个记录
http://kaldi-asr.org/models.html
这网站是Kaldi中各种语音任务pretrained过的模型
有视源ASR的, xvector做声纹识别的, emebedding做diarization的, 大部分是用LDC的死贵死贵的语料训练的
直接把这些模型拿去解码或者拿去用都可以得出一个很不错的效果,
我们在x-vector参加的NIST评测和自己实验的视源ASR模型上的效果很好
当然模型自己训练也完全没问题
做个记录
http://kaldi-asr.org/models.html
这网站是Kaldi中各种语音任务pretrained过的模型
有视源ASR的, xvector做声纹识别的, emebedding做diarization的, 大部分是用LDC的死贵死贵的语料训练的
直接把这些模型拿去解码或者拿去用都可以得出一个很不错的效果,
我们在x-vector参加的NIST评测和自己实验的视源ASR模型上的效果很好
当然模型自己训练也完全没问题