基于科大讯飞的语音识别

最新推荐文章于 2021-08-30 22:18:47 发布

巫巫巫

最新推荐文章于 2021-08-30 22:18:47 发布

阅读量3.3k

点赞数

分类专栏： Android原创

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/akon405/article/details/28702197

版权

Android原创专栏收录该内容

56 篇文章 0 订阅

订阅专栏

科大讯飞本身有“语音+”平台，这里没有使用“语音+”而我使用的是其SDK，用来集成到自己的APP中。

其SDK按功能分为三种：

1.合成即把文字转为语音（暂未使用）

2.识别我们自己上传字库，然后科大讯飞的平台可以从语音中识别我们上传的字库

3.开放语义类似于智能化的人机交互

我只是使用到了开放语义功能，科大讯飞SDK通过理解语义来生成JSON，然后我们解析JSON。使用的过程如下：

1.首先去注册科大讯飞的账号

2.选择开放语义的场景并和引用相关联（这里会得到一个APPID）

3.开始本地开发APP，导入科大讯飞的开放语义的SDK。

4.首先注册APPID，也就是说把本地应用程序和APPID相关联

//用户登录
SpeechUser.getUser().login(MainActivity.this, null, null
, “appid=” + getString(R.string.app_id), listener);

5.初始化语义理解对象：
speechUnderstander = SpeechUnderstander.createUnderstander(this)

6.清空Grammar_ID，防止语义理解后进行语义理解时Grammar_ID的干扰
speechUnderstander.setParameter(SpeechConstant.CLOUD_GRAMMAR, null)

7.设置语义理解的引擎

speechUnderstander.setParameter(“asi”, “1″)
speechUnderstander.setParameter(SpeechConstant.DOMAIN, “iat”)

8.设置采样率参数，支持8K和16K speechUnderstander.setParameter(SpeechConstant.SAMPLE_RATE,”8000″)

9.开始识别语义：speechUnderstander.startUnderstanding(listener)

10.实现监听器：SpeechUnderstanderListener,当触发startUnderstanding方法后，监听器开始工作，其可以监听语音（说话的开始到结束都会触发相对于的函数），然后分析结果。

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。