kaldi nnet3实时解码（使用麦克风在线解码）

最新推荐文章于 2024-07-26 10:07:48 发布

置顶

遇逆境处之泰然

最新推荐文章于 2024-07-26 10:07:48 发布

阅读量2.1k

点赞数 1

分类专栏：语音识别 C/C++ 文章标签：语音识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cj1989111/article/details/115344323

版权

前言

好久没有更新博客，自从有小孩之后，留给自己的时间越来越少，加上最近一段时间在学习深度学习方面的理论知识，所以博客的更新拖的时间太长了。
最近经常留意到kaldi交流群中，不断有小伙伴提问有没有实时解码的例子，其实kaldi有一个实时麦克风解码的demo,只不过是基于gmm的，详见online-gmm-decode-faster.cc ，一直没有nnet3实时解码样例，所以抽空写了一个demo, 见我的github: online2-nnet3-latgen-faster.cc

顺便解释一下在线解码和离线解码的概念：

在线解码：一段音频分词若干个chunck，每次解码取一个chunck，你可以想象食堂打饭时，每个同学排好队，一个一个打饭（不允许插队），每解一个chunck，都会取最优的解码结果，参考siri, 当你说一段话的时候，发现之前不准确的词会随着音频信息的增多得到修正，优点：及时反馈结果，缺点：解码结果没有离线解码准确
离线解码：一次性提取完特征，然后解码，最后取最优路径，获得解码结果，优点：解码结果较在线解码准确，缺点：实时反馈慢

最低0.47元/天解锁文章

遇逆境处之泰然

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
10
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

遇逆境处之泰然 CSDN认证博客专家 CSDN认证企业博客

码龄15年

23: 原创

7万+: 周排名

169万+: 总排名

6万+: 访问

: 等级

920: 积分

98: 粉丝

42: 获赞

102: 评论

148: 收藏

私信

关注

热门文章

分类专栏

最新评论

嵌入式平台Portaudio的交叉编译
西门吹牛: 老哥你能不能多写点啊实在是编译不过去了
嵌入式平台Portaudio的交叉编译
hugerat: 其实只要在configure时，做好配置就行，不用手动修改。看我的配置 ./configure -prefix=$PWD/_install --host=arm-linux-gnueabihf CFLAGS=-I/usr/local/custom_install_arm/alsa_lib/include/ LDFLAGS=-L/usr/local/custom_install_arm/alsa_lib/lib 主要是用CFLAGS，LDFLGAS参数指定编译好的alsa库和头文件所在位置，然后在执行完configure后，用make即可顺利编译完成。
基于kaldi训练唤醒词模型的一种方法
海边的小菜鸡: 博主你好，我想问一下训练若干个关键词大概需要的语料量是多少？比如就训练一个“小米”作为激活词，需要录制多少条语音，集外词的语音需要多少条？期待博主指导，谢谢
嵌入式平台OpenBlas及Clapack的交叉编译
fnger: 调用时候，发生了函数未定义错误sgemm_ 等几个，找c源码时候，发现函数确实只有声明，没有定义看来还是缺了点东西
嵌入式平台OpenBlas及Clapack的交叉编译
fnger: 写的好细致我也编译成功了我的版本高一点，略微改变。思路一样的。赞博主

大家在看

最新文章

目录

评论 10

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。