调用Google手机版语音识别服务

本文介绍了一种调用Google手机版语音识别服务的方法,通过对比www.google.com/speech-api/v1/recognize和www.google.com/m/voice-search,揭示后者在3G网络下速度更快,流量更小,识别更准确。作者通过分析VoiceSearch的APK,揭示了其工作原理,包括protobuf数据传输协议、建立session、录音、发送数据、获取结果等步骤,并提供了相关项目的源代码链接。
摘要由CSDN通过智能技术生成

转载请注明出处

项目代码https://github.com/zuoshu/android-voicesearch-opensource.git

调用google手机版语音识别云服务,3g网络下速度快,流量小,识别准,无弹出框。

 

由于项目需要用到语音识别,选用google的语音识别服务,现在一般的做法是将语音通过post发到http://www.google.com/speech-api/v1/recognize?lang=en-us,再从返回里面取识别结果。在wifi的情况下速度还可以接受,但是在3g的情况下速度很慢。和Android上的VoiceSearch比起来慢很多。看了下VoiceSearch的log,发现voicesearch连接的其实是www.google.com/m/voice-search。一般的做法最初是从chrome开源代码里面找到的,而VoiceSearch属于android平台,在google内部这两个产品分属两个不同的团队,猜测后台的语音识别服务其实实现了两套?总而言之,android/ios和chrome使用的语音识别是不一样的,并且android/ios的速度要快很多。

但是,VoiceSearch不开源,没办法,只能从反编译apk入手,有些地方反编译也没办法,过程比较费劲,直接上结果。

这个是使用www.google.com/speech-api/v1/recognize作为语音识别服

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: LabVIEW可以通过调用系统Net进行语音识别语音识别是一种将口头语言转换为文本或命令的技术,通过此技术可以实现语音控制和交互。 首先,需要确保系统中已安装合适的语音识别引擎和Net框架。然后,在LabVIEW中使用Net库函数来调用系统Net进行语音识别。Net库函数可以实现与.Net框架交互的功能。 在LabVIEW中,可以使用.Net库函数创建一个Net对象,并使用该对象来调用系统Net的相关功能。例如,可以使用Net对象的方法来进行语音识别,将语音转换为文本。 具体步骤分为以下几个部分: 1. 创建一个Net对象,将其与系统Net相关的库函数进行关联。 2. 配置Net对象的参数,如设置语音识别的语言、声音输入设备等。 3. 调用Net对象的方法,通过传递语音数据进行语音识别,将语音转换为文本。 4. 处理识别结果,例如在LabVIEW界面中显示识别的文本、执行相应的命令等。 需要注意的是,语音识别是一个复杂的技术,具体实现的方法和步骤可能因使用的语音识别引擎和.Net框架不同而有所不同。因此,在实际应用中,需要结合具体的语音识别引擎和.Net框架的文档和示例来进行相应的配置和编程。 总之,使用LabVIEW调用系统Net进行语音识别需要先创建一个Net对象,并根据具体需求进行配置和调用相关方法,最后处理识别结果。通过这种方式,可以实现在LabVIEW环境中进行语音识别的功能。 ### 回答2: LabVIEW是一种强大的图形化编程工具,可以用于处理各种数据和信号。LabVIEW提供了很多丰富的库和工具,其中包括可以调用系统net进行语音识别的功能。 在LabVIEW中,首先需要安装并配置语音识别引擎,例如Microsoft Speech Platform。然后,可以使用LabVIEW中的System Exec.vi函数来调用系统命令行,并使用命令行参数启动语音识别程序。这样,LabVIEW就可以调用系统net进行语音识别。 在调用系统net进行语音识别之前,还需要将音频信号输入到语音识别程序。可以使用LabVIEW中的声音采集功能,将麦克风输入的音频数据进行采集,并将其传递给语音识别程序。 在语音识别程序完成识别后,可以将识别结果返回给LabVIEW进行后续的处理和分析。LabVIEW提供了强大的数据处理和分析功能,可以使用这些功能来处理和解析语音识别结果。 通过将LabVIEW与系统net相结合,我们可以实现在LabVIEW中调用系统net进行语音识别的功能。这使得LabVIEW在语音识别领域的应用更加灵活和强大,可以应对不同的语音识别需求。 ### 回答3: LabVIEW是一种图形化编程环境,用于进行数据采集、控制和分析。它可以与各种硬件和软件进行通讯,实现不同应用的开发。 LabVIEW可以调用系统的NET库,从而实现语音识别功能。这里的NET库是指.NET Framework,它是由微软开发的一种软件框架,提供了广泛的功能和类库,包括语音识别的相关功能。 要在LabVIEW中调用系统的NET库,首先需要编写一个.NET类库或者使用已有的.NET类库。然后,通过LabVIEW的.NET互操作性功能,将.NET类库引入到LabVIEW的工作环境中。 在.NET类库中,可以使用.NET Framework提供的语音识别相关的类和方法,来实现语音识别的功能。这些类和方法可以进行音频输入、语音识别、文本转换等操作。 在LabVIEW中,可以根据需要设计图形界面、调用不同的功能模块,来完成语音识别的任务。通过与.NET库的交互,LabVIEW可以获取音频输入数据,并将其传递给.NET库进行语音识别。然后,LabVIEW可以处理返回的识别结果,并在界面上进行展示或后续的处理。 需要注意的是,要在LabVIEW中成功调用系统的NET库进行语音识别,需要对LabVIEW以及相关的.NET技术有一定的了解。同时,还需要具备一定的编程能力和对语音识别的算法有所了解,以便能够设计和实现合适的功能模块。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值