MMS论文中关于语种识别的内容摘要

MMS论文中关于语种识别的内容摘要

前言

摘要翻译一些内容。

论文地址请看这里

语种识别相关内容

LID from mms paper 01

  1. Whisper支持LID,可以区分99种不同的语言;
  2. 有人使用wav2vec 2.0实现LID,数据集中包含10种亚洲语言;
  3. Tjandra等人证明,跨语言自监督模型可以通过使用专有数据集训练26种语言的语言识别模型来提高语言识别性能。
  4. Babu等人使用VoxLingua-107数据集对预训练模型进行微调,以对107种语言进行LID;
  5. MMS将语言数量扩展到4000多种。

训练配置

我们通过微调MMS(1B)预训练模型进行语言识别来训练模型。这是通过在预训练的模型上堆叠一个线性分类器来实现的,该分类器映射到集合为特定任务选择可能的语言,然后微调所有参数,包括预训练模型。

实验结果

实验结论

MMS的确好一些。
但ASRL、SpeechBrain,AmberNet也都还不错,还需要再比较一下模型大小。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值