pocketsphinx使用语言模型和词典进行语音识别时,报错FATAL: continuous.c, line 245: Failed to open audio device

本文档详细介绍了在使用pocketsphinx进行汉语语音识别时遇到的FATAL错误,即无法打开音频设备的问题。通过分析错误,确定问题在于音频服务配置,并通过尝试移除pulseaudio并切换到alsa解决。最终成功运行pocketsphinx_continuous,但识别效果有待提升。
摘要由CSDN通过智能技术生成

1. 安装pocketsphinx

打开链接https://cmusphinx.github.io/wiki/download/
按照以下顺序安装:
1)Sphinxbase
2)Sphinxtrain
3)Pocketsphinx

解压后进入对应文件夹,
./configure
make
make install

安装成功后,采用示例音频文件进行pocketsphinx_continuous语音识别功能检验:
1)cd pocketsphinx-5prealpha/test/data/cards
2)pocketsphinx_continuous -infile 005.wav > 005.result
3)cat 005.result

eight of spades for up close seven of hearts

2. 下载汉语语言包

pocket_sphinx默认是包含英语语言包, 如果想进行汉语识别,需要先下载普通话语言包:
1)打开https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/
2)选择Mandarin

下载加压后没有规定的路径,我个人放在了(和内嵌英语语言包对应):
pocketsphinx-5prealpha/model/zh-cn
README zh_cn.cd_cont_5000

评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值