WeNet 热词增强 2.0 强势来袭

WeNet 更新热词增强 2.0,采用AC自动机解决热词间重叠问题。通过构建热词前缀树和添加回退弧,优化了匹配效率。实验表明在含热词数据上,热词增强2.0略有下降,可能因语言模型剪枝。团队将继续探索深度学习的热词增强算法。
摘要由CSDN通过智能技术生成

继《WeNet 更新:支持热词增强》两年后,WeNet 近期更新了热词增强 2.0。本次更新内容是使用 AC 自动机 (Aho-Corasick automaton) 对热词进行构图,解决热词之间存在的重叠问题[1]。

早在 2022 年 5 月份,@victor45664 就在 Github 上 Pull Request 了相关的代码实现[2](非 OpenFST 版本)。

图片

巧的是,当时 WeNet 也正在开发 OpenFST 版本的 AC 自动机热词增强。更巧的是,K2 近期也开源了相关的实现,感兴趣的同学可以参考《新一代 Kaldi 热词识别功能》[2]。

热词增强原理

我们来回顾一下语音识别解码和热词增强的原理:

图片

我们可以简单地认为 WeNet 训练出来的声学模型是一个多分类器,例如对于常用的 5000 个汉字,每输入一帧音频,模型输出一个 5000 维的向量。解码就是要在多帧音频对应的多个 5000 维向量中,剪枝掉概率较小的文字序列,保留概率较大的文字序列。

热词增强则是在剪枝的过程中,不仅考虑声学模型输出的概率,也考虑匹配热词得到的奖励,最终提高包含热词的文字序列

  • 17
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值