android 语音识别离线,Android离线语音识别 PocketSphinx

最新推荐文章于 2024-01-08 09:52:11 发布

莉莉莉莉酱

最新推荐文章于 2024-01-08 09:52:11 发布

阅读量850

点赞数

文章标签： android 语音识别离线

本文将使用PocketSphinx来实现Android平台的离线语音识别

优点: 离线,不用联网识别较准(大家都说99% 我觉得只有80%)

缺点: 自定义语音命令麻烦只能小范围识别

网上看了很多例子我跟你说那都是坑根本就是错误的教程...

不废话开始教程:

1.先确定要识别的词组

我的需求是实现离线识别以下词组

中文: 向前向后向左向右

英文: FORWARD BACKWARD TURNLEFT TURNRIGHT

(很多这样的教程好像基本没教怎么识别英文来着...)

2.生成并修改lm和dic文件

先生成中文的新建一个txt文件命名为 text.txt

并把向前向后向左向右这四个词写上去,然后保存..

如图

e85e86ac9b99

注意很多文章都说这样的格式向前

这样的格式我只想跟你说你被坑了... 这样做出来的语音识别demo是没有任何识别反应的真害人..

打开这个链接在线转换lm文件 , 点击选择文件选择刚才的text.txt文件

e85e86ac9b99

然后点击 COMPILE KNOWLEDGE BASE 提交

然后分别打开这两个文件查看内容并分别复制内容到新建的text.dic和text.lm文件里, 保存 (如果乱码请使用谷歌浏览器或修改浏览器显示编码)

e85e86ac9b99

例如我的 text.dic文件文本内容为:(我本来是写向前向后向左向右现在你看顺序乱了我不知道这样的目的我建议保留转换后的顺序可能与优先级有关吧)

向前

向右

向后

向左

而text.lm的内容为

Language model created by QuickLM on Tue Nov 22 03:42:55 EST 2016

The model is in standard ARPA format, designed by Doug Paul while he was at MITRE.

The code that was used to produce this language model is available in Open Source.

Please visit http://www.speech.cs.cmu.edu/tools/ for more information

The (fixed) discount mass is 0.5. The backoffs are computed using the ratio method.

This model based on a corpus of 4 sentences and 6 words

\data\

ngram 1=6

ngram 2=8

ngram 3=4

\1-grams:

-0.7782 -0.3010

-0.7782 -0.2218

-1.3802 向前 -0.2218

-1.3802 向右 -0.2218

-1.3802 向后 -0.2218

-1.3802 向左 -0.2218

\2-grams:

-0.9031 向前 0.0000

-0.9031 向右 0.0000

-0.9031 向后 0.0000

-0.9031 向左 0.0000

-0.3010 向前 -0.3010

-0.3010 向右 -0.3010

-0.3010 向后 -0.3010

-0.3010 向左 -0.3010

\3-grams:

-0.3010 向前

-0.3010 向右

-0.3010 向后

-0.3010 向左

\end\

还有的说有什么UTF-8编码问题我只想说我没遇到我用的Sublime Text3文本编辑器你如果有问题你换我这个文本编辑器试试

完成上面的然后脑残的一步来了手动找字典(拼音)

哪里来的拼音字典? 先去这里下载一个压缩文件

https://sourceforge.net/projects/cmusphinx/files/pocketsphinx/0.7/然后找到 pocketsphinx-0.7.tar.gz 点击下载(下不动用迅雷)

下载好后解压

pocketsphinx-0.7\pocketsphinx-0.7\model\hmm\zh\tdt_sc_8k 为中文语言模型文件

pocketsphinx-0.7\model\lm\zh_CN\xxxx.dic为拼音读音字典

同理

pocketsphinx-0.7\model\hmm\en_US\hub4wsj_sc_8k 为英文语言模型文件

pocketsphinx-0.7\model\lm\en_US\xxxx.dic 为英文读音字典

你还会发现有台湾的等等

我目录的中文语言文件字典为mandarin_notone.dic 打开你会发现里面有很多文字对应读音(拼音)

e85e86ac9b99

这时我们回到刚才的text.dic和text.lm文件打开text.dic文件

一个词一个词在mandarin_notone.dic字典中快捷键查找 (词找不到就单个字找) 然后复制拼音到相应的词语右边注意拼音和词语要至少留一个空格然后拼音和拼音之间也要留一个空格

编辑text.dic文件,我的找好了如下:

向前x iang q ian

向右x iang y ou

向后x iang h ou

向左x iang z uo

好了保存...

英文的也一样步骤字典的话,要从英文字典上查英文最好都大写并且多个单词时最好不留空格

3.没了(第一篇简书 ~ 就是这么草率...)

编写安卓程序?

代码太多略.. 但我文章下面直接放demo

网上其他教程很多都是打开demo就闪退其实原因是

你还要手动复制模型和字典文件到sd卡上

我写的这个demo也是基于它, 但我解决了这个问题我把文件放在 assets里并且我把模型文件和字典都整合放到一起了 ,如下

e85e86ac9b99

这样就能自动复制文件到临时路径并让你们快速实现离线语音功能程序员不需要担心其他操作.

实际情况下那demo遗留了一个严重的bug 就是过100s左右会c库异常闪退这个问题我也解决了

还有个文字不断重复和回调一直回调同一个识别答案这个问题也解决了...

我做了判断 , 文件都放在data/data/com.packagename.xxx/file/下

并且根据手机语言切换识别中文还是英文...

publicRecognizerTask(Context context) {

String dataPath = context.getFilesDir().getAbsolutePath();

File zhPath =newFile(dataPath +"/voice/zh");

if(!zhPath.exists()) {

zhPath.mkdirs();

}

File enPath =newFile(dataPath +"/voice/en");

if(!enPath.exists()) {

enPath.mkdirs();

}

pocketsphinx

.setLogfile(dataPath +"/voice/pocketsphinx.log");

String rootPath = isZh(context) ? zhPath.getPath() : enPath.getPath();//根据环境选择中英文识别

String dicPath = rootPath +"/text.dic";

String imPath = rootPath +"/text.lm";

if(!newFile(dicPath).exists()) {

releaseAssets(context,"/", dataPath);

}

Config c =newConfig();

c.setString("-hmm", rootPath);

c.setString("-dict", dicPath);

c.setString("-lm", imPath);

c.setFloat("-samprate",8000.0);

c.setInt("-maxhmmpf",2000);

c.setInt("-maxwpf",10);

c.setInt("-pl_window",2);

c.setBoolean("-backtrace",true);

c.setBoolean("-bestpath",false);

this.ps =newDecoder(c);

this.audio =null;

this.audioq =newLinkedBlockingQueue();

this.use_partials =false;

this.mailbox = Event.NONE;

}

代码很简单的放Demo吧

我去, 怎么简书没代码高亮提示还有怎么上传资源... 知道的说下.. 我只能传CSND的了

~~~~~点我下载~~~~~

莉莉莉莉酱

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
android 语音识别离线,Android离线语音识别 PocketSphinx

本文将使用PocketSphinx来实现Android平台的离线语音识别优点: 离线,不用联网识别较准(大家都说99% 我觉得只有80%)缺点: 自定义语音命令麻烦只能小范围识别网上看了很多例子我跟你说那都是坑根本就是错误的教程...不废话开始教程:1.先确定要识别的词组我的需求是实现离线识别以下词组中文: 向前向后向左向右英文: FORWARD BACKWARD TU...
复制链接

扫一扫

android 语音识别 离线,Android离线语音识别 PocketSphinx

“相关推荐”对你有帮助么？

android 语音识别离线,Android离线语音识别 PocketSphinx