基于科大讯飞的语音识别

科大讯飞本身有“语音+”平台,这里没有使用“语音+”而我使用的是其SDK,用来集成到自己的APP中。

其SDK按功能分为三种:

1.合成  即把文字转为语音(暂未使用)

2.识别  我们自己上传字库,然后科大讯飞的平台可以从语音中识别我们上传的字库

3.开放语义  类似于智能化的人机交互

我只是使用到了开放语义功能,科大讯飞SDK通过理解语义来生成JSON,然后我们解析JSON。使用的过程如下:

1.首先去注册科大讯飞的账号

2.选择开放语义的场景并和引用相关联(这里会得到一个APPID)

3.开始本地开发APP,导入科大讯飞的开放语义的SDK。

4.首先注册APPID,也就是说把本地应用程序和APPID相关联

//用户登录
SpeechUser.getUser().login(MainActivity.this, null, null
, “appid=” + getString(R.string.app_id), listener);

5.初始化语义理解对象:
speechUnderstander = SpeechUnderstander.createUnderstander(this)

6.清空Grammar_ID,防止语义理解后进行语义理解时Grammar_ID的干扰
speechUnderstander.setParameter(SpeechConstant.CLOUD_GRAMMAR, null)

7.设置语义理解的引擎

speechUnderstander.setParameter(“asi”, “1″)
speechUnderstander.setParameter(SpeechConstant.DOMAIN, “iat”)

8.设置采样率参数,支持8K和16K speechUnderstander.setParameter(SpeechConstant.SAMPLE_RATE,”8000″)

9.开始识别语义:speechUnderstander.startUnderstanding(listener)

10.实现监听器:SpeechUnderstanderListener,当触发startUnderstanding方法后,监听器开始工作,其可以监听语音(说话的开始到结束都会触发相对于的函数),然后分析结果。

科大讯飞语音识别demo(离线)是基于科大讯飞公司开发的一款语音识别技术的演示版本。通过这个demo,我们可以快速了解到科大讯飞语音识别的基本功能和特点。 首先,科大讯飞语音识别demo(离线)提供了离线语音识别的能力,即在没有网络连接的情况下也能进行语音识别。这在某些特殊环境中非常有用,如没有网络覆盖的地区或者需要保护隐私的场合。 其次,这个demo支持多语种的语音识别,可以识别包括中文、英文和其他一些主要语种在内的多种语言。这对于用户来说非常方便,无论是在国内还是国外,都能够得到准确的语音识别结果。 此外,科大讯飞语音识别demo(离线)还提供了一些自定义的功能,如识别结果的输出格式可以进行调整,可以根据用户的需求输出文字、拼音或者音素等不同形式的识别结果。同时,还可以设置一些参数,如语速、音量等,来调整识别的效果。 最后,科大讯飞语音识别demo(离线)还具备良好的稳定性和准确性。科大讯飞作为国内领先的语音识别技术提供商,其语音识别技术在行业内享有很高的声誉。在这个demo中,用户可以体验到科大讯飞的最新技术成果,享受到高质量的语音识别体验。 总结来说,科大讯飞语音识别demo(离线)是一款功能丰富、稳定准确的语音识别演示版本。通过这个demo,用户可以快速了解并体验科大讯飞语音识别技术的优势和特点,为进一步应用和开发提供了便利。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值