WeNet 更新:支持热词增强

本文介绍了WeNet语音识别系统中热词增强的功能,通过CTC Prefix Beam Search和CTC WFST Beam Search两种解码器实现热词识别准确率提升。在解码过程中,使用Context Graph进行热词得分计算,并通过实验展示了热词增强的效果。然而,目前方案存在一些限制,如context_score的合理设置等,期待社区贡献解决方案。
摘要由CSDN通过智能技术生成

在语音识别的实际应用中,对于常用的词汇识别效果比较好,但是对于一些特有的人名、歌名、地名或者某个领域的专有词汇,例如人名宋星辰、歌名国际歌、地名丽泽商务区以及语音识别专业词汇解码器,可能存在识别准确率不高的情况。对于这些专有词汇,通过在 WeNet 中使用热词增强方案,添加热词可以显著提升识别的准确率。

近期,WeNet 的更新支持了两种解码器上热词增强,包括 CTC Prefix Beam Search 和 WFST Beam Search。

热词增强

热词增强在论文中也叫 Context Biasing 或者 Contextual Biasing,相当于是把一些先验的知识加入到了语音识别系统中。WeNet 在解码过程中维护一个 Context Graph 中的状态。通过子图中的状态计算热词的得分,然后通过浅融合 (Shallow Fusion) 的形式在束搜索的过程中进行加分。

声学得分和热词得分的加权公式如下:

Context Graph

假如我们需要对下述热词进行增强:

  • 王思

  • 欧阳唯一

  • 唯品会

指定热词中每个字的得分为 3,则 Context Graph 的构图如下图所示:

</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值