各安卓开源离线语音识别项目的测试结果

最新推荐文章于 2025-04-13 00:32:23 发布

对我是

最新推荐文章于 2025-04-13 00:32:23 发布

阅读量809

点赞数 3

分类专栏： Android开发文章标签： android java 语音识别开源

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/l156789/article/details/142760609

版权

Android开发专栏收录该内容

3 篇文章

订阅专栏

以下项目代码测试用的都是Java。

Whisper-android

试了试demo，不支持流式处理，示例代码的record版本就是先录音到固定文件再转换。会出现单词死机式循环输出，之前用whisper原模型的时候就已经出现这种问题了。

Vosk

允许调整模型，有onPartialResult但没有onRmsChanged，实现不了根据音频实时音量大小做前端反馈。模型效果一般，说话快一些容易导致错误识别结果。而且对应语言模型就完全只能用于该语言，中文模型就一点英文都识别不出来，OK都不行。

Mozilla DeepSpeech

需要完整的音频文件才能开始识别，不能边录边识别。MPL协议。项目已经发公共停止维护了。最新一次release在20年，java版本低，没有上手试效果。

Pocketsphinx

这个模型和Kaldi都是主用于关键词检测的语音模型，主要由字典模型和声学模型构成。只要你没在字典给出的词他就识别不出来，但字典大了启动延迟大，在字典词汇上万之后会容易bug。识别准确率一般，而且特别容易把环境音识别出文本，即使是正常把手机放在一边什么也不干，只要环境音杂一点就会出问题。用来做语音唤醒或者语音功能那些可以，语音转录不合适。

Kaldi

Android用kaldi官方要编译。我直接用了vosk兼容的Kaldi模型，就着vosk的demo框架试了试。模型大小2.5g，手机上每次加载都需要一定等待时间。此外还是那个问题，英文一点都识别不出来，而且出来的结果因为都是一个词一个词识别的，句子容易不连贯出现错词。效果相比Pocketsphinx确实好很多了，没有那么受环境音影响，识别准确率也比Pocketsphinx好一些。

SherpaNcnn

实时识别，效果还不错。java用的话需要先编译，可以直接下载他github上编译好的文件，不过需要自己写一下读取模型文件的代码。

综上，选SherpaNcnn。

博客等级

码龄16年

7
原创

58
点赞

67
收藏

40
粉丝

关注

私信

热门文章

分类专栏

Android开发 3篇

展开全部收起

最新评论

语音识别+AI总结项目搭建回顾
陌上雨落დ: 我接了本地的qwen2.5，还没微调
语音识别+AI总结项目搭建回顾
对我是: 是的，本地模型如果针对总结类任务微调一下也许效果会比geminiflash好
语音识别+AI总结项目搭建回顾
陌上雨落დ: 大佬太牛了！可以尝试对接本地大模型，这样就可以完全离线了，github已star
吉林大学大学计算机笔记
CSDN-Ada助手: 恭喜您开始博客创作！标题“吉林大学大学计算机笔记”让我感到很兴奋，因为我也是计算机领域的学生。写下自己的学习笔记是一个非常棒的方式，既能帮助您巩固所学知识，也能与他人分享您的学习心得。接下来，我建议您可以进一步扩展博客内容，例如分享一些实践经验、解决问题的方法或者对未来计算机领域的发展趋势的预测。这样的创作将帮助更多人受益，并促进您自身的学习成长。期待看到您更多精彩的博客文章！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
吉林大学数据科学与大数据技术专业部分课程笔记
CSDN-Ada助手: 这篇博客内容真是丰富多彩，涵盖了吉林大学数据科学与大数据技术专业的课程笔记，对于想要深入学习这个领域的人来说无疑是一份宝贵的资料。希望作者能够继续保持创作，分享更多关于数据科学与大数据技术的知识和经验。除了已经提到的课程内容，我想补充一些和大数据相关的技能和知识，比如Hadoop、Spark、数据挖掘、数据清洗与处理等方面的内容。希望能够对读者有所帮助。期待作者更多的精彩内容！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。