讯飞语音实战(1)

讯飞云开放平台http://www.xfyun.cn/,其实早在三月份就注册了一个帐号,这些天看见机器人群的一个群友在做语音,还给我发了一个语音识别放歌曲的视频,我感觉像那么回事,自己兴趣一下就来了,先试试看。


可以申请多个服务,也可以是一个,如上图所示。我这里是拿一个服务做例子。建议一开始多开几个服务,后文就是由于开少了出了点问题(包括离线命令字识别,离线语音合成,申请开发云语义,语音唤醒)

下载的Linux下的SDK有这么几个文件,外加一个README,短小精悍,很对胃口。

进到samples里依次编译每个程序,首先source 64bit_make.sh创建环境变量并且借助当前目录下的Makefile编译程序,编译好的程序在bin目录下。

几个缩写词解释《Development Manual_MSP50.pdf》


  1. asr_sample (Automatic Speech Recognition)语音识别
注意这里运行程序的时候要先指定库目录的位置哦,即LD_LIBRARY_PATH=...这句,是在用BeagleBone的时候学到的,有些东西是互通的。

因为本地有一段电话号码的文本,以后缀abnf结尾,README里称它为(abnf语法样例)打开后有些乱码,我会换到windows下试试。


2. iat_record(iFly Auto Transform)语音转文字,语音听写

它的结果

关键字放在了下图中,录音是说的:中美速控。不知是系统原因还是没有识别到,显出的是乱码。

3. 实时语音转文字

这个跟第二个差不多

用户词表,用来提高识别率

4. tts 文字转语音


5. sch_speak 语音语义技术能够将语音听写业务中的内容进行语义解析

6. sch_text 语音理解,本地文本

搜索了一下14002是服务端脚本错误。使用开放语义需要到开放语义平台勾选语义场景,网址:http://www.xfyun.cn/index.php/services/osp,不勾选可能会报14002错误码

后来网页上开通后就可以了,也不用重新下载SDK,结果如下图所示:


跑完他们的例子,体验了他们的三大主要服务,语音识别语音转文字文字转语音,语义理解没跑通

另外使用指令 LD_LIBRARY_PATH=../libs/x64 gdb ./sch_text 可以调用gdb来调试程序



===================2016.11==============================

在《MSC Novice Manual for Linux.pdf》中

也见过将libmsc.so拷贝到/usr/lib下的做法,我上面的做法也只是其中一个,但相对来说稍微繁琐点,每次都需要输入。

Save
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

yaked19

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值