kaldi nnet3实时解码(使用麦克风在线解码)

前言

好久没有更新博客,自从有小孩之后,留给自己的时间越来越少,加上最近一段时间在学习深度学习方面的理论知识,所以博客的更新拖的时间太长了。
最近经常留意到kaldi交流群中,不断有小伙伴提问有没有实时解码的例子,其实kaldi有一个实时麦克风解码的demo,只不过是基于gmm的,详见online-gmm-decode-faster.cc ,一直没有nnet3实时解码样例,所以抽空写了一个demo, 见我的github: online2-nnet3-latgen-faster.cc

顺便解释一下在线解码和离线解码的概念:

  1. 在线解码:一段音频分词若干个chunck,每次解码取一个chunck,你可以想象食堂打饭时,每个同学排好队,一个一个打饭(不允许插队),每解一个chunck,都会取最优的解码结果,参考siri, 当你说一段话的时候,发现之前不准确的词会随着音频信息的增多得到修正, 优点:及时反馈结果, 缺点:解码结果没有离线解码准确
  2. 离线解码:一次性提取完特征,然后解码,最后取最优路径,获得解码结果,优点:解码结果较在线解码准确,缺点:实时反馈慢
  3. </
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值