关于在WP7应用里加入Speech To Text (语音识别) 记录

原创 2013年09月29日 14:18:44

这是本人的第一篇文章,大家看看吧,有什么不对的地方还请指出,但请文明发言。。

========================================================================================================

关于代码,由于量有点多,这边传不方便,可以在这里找到

http://download.csdn.net/detail/zhang_pei/6338193


学习WP一个多月了,最近上头的建模终于下来了,功能比预期的多了一些,其中有一个功能就是语音输入,我第一想到的就是TX的那个。

       由于平台要求是在WP7里,也就是不能使用WP8里自带的语音识别方法了,度娘了半天,  也没有个确切的答案,愁啊。

       虽然没有找到单纯的介绍这一块的文章,但也不是没有收获,有一些零零碎碎的东西,拼在一起来就可以实现我想要去效果。


        首先,是看到这里http://blog.csdn.net/dlangu0393/article/details/7214728  才稍稍有点头绪,怎么说呢,虽然用的是QT,但是撇开代码,上面讲的思路还是对的,用的是

GOOGLE的语音识别接口,POST请求,很方便。

     来说一下大概的思路吧:

   一、收集声音数据

   二、编码成GOOGLE接口上能识别的格式

   三、发送,接收,处理(Json数据格式)

  这里是Google Speech API的地址,我用的就是这个:

   http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN&maxresults=1

  音频编码格式:

FLAC或WAV或SPEEX

详情见链接文章。



然后,我又看了这两篇    (录音篇)   http://www.2cto.com/kf/201203/122741.html 

                                            (保存篇) http://www.2cto.com/kf/201203/122742.html


刚开始还在纠结,因为接口识别的声音类型很有限(已知的),我又没做过声音的编码,后来一想,上面那篇关于声音保存的文章说得就是把声音保存成WAV,我为什么不截取


他其中的一段,做好编码后,不写入文件而是配合HTTP头,POST到接口上去,经实验,这思路是正确的,感谢上述三篇文章提供者。


讲到这里,思路讲完了,关于代码,由于量有点多,这边传不方便,可以在这里找到

http://download.csdn.net/detail/zhang_pei/6338193





  





IBM的语音识别(IBM speech to text 语言转换成文字)

参考资料: https://www.ibm.com/watson/developercloud/speech-to-text.html

使用python和IBM speech to text 进行 语音识别

目录视图 摘要视图 订阅 CSDN日报20170303——《百亿互金平台救火故事》      程序员2月书讯     社区有奖问答--一起舞动酷炫的iOS动画    ...
  • yuanya
  • yuanya
  • 2017年03月08日 00:53
  • 872

IBM watson API解析1-Speech To Text(语音转文本)

前期准备1、注册Bluemix账号需要一个IBM的Bluemix账号,已有账号的可直接登陆,若无账号,点击注册进行注册。 注册时国家或地区默认的,否则可能会出错。2、安装watson-dev...

Android:使用Speech To Text API进行语音到文本转换

Android有一个非常酷的特性很多开发者都还不知道。Any.DO之类应用的语音到文本转换功能很有创意。在现在Siri的世界里,语音指令是极其重要的。Android原生提供Speech To Text...

Text-To-Speech(TTS)语音朗读

Text-To-Speech(TTS)语音朗读更新: 2010-04-08来源: 互联网字体:【大中小 】-TextToSpeech简称 TTS,是Android 1.6版本中比较重要的新功能。将...

【wp7】简易的语音报时懒人闹钟

当年赶出来的windows phone的小程序,这次UID实验又拿出来弄了个报时。。话说之前感觉很喜欢的拖拽现在好讨厌,好在UI已经确定了,只是加上了语音报时的功能。声音不是很连贯,没办法自己录的也没...

WP7-Expression Blend 为Banner Text控件创建动画效果

转自:http://www.devdiv.com/thread-36650-1-1.html   帧定义一个动画效果的开始点和结束点。在Expression Blend中,你通过创建一个stor...

Wp7中TextBlock超长Text文本的正确显示

wp7中TextBlock的显示有文本数量的限制,当超过2048个字符(约数),后面的字符就不显示了。实际测试发现高度超过2000px(约数)时,后面的内容即显示为空白。其原因可能是微软在设计的时候考...

基于微软speech的语音识别

  • 2012年04月29日 08:21
  • 36.83MB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:关于在WP7应用里加入Speech To Text (语音识别) 记录
举报原因:
原因补充:

(最多只允许输入30个字)