Java语音程序开发用户指南

1 概述

本文档是开发科大讯飞Java语音程序的用户指南,定义了语音听写、语音识别、语音合成以及语义理解相关接口的使用说明和体系结构,如图1所示。




科大讯飞语音功能抢先体验:

http://www.xfyun.cn/default/online_demo

2 预备工作

支持Java平台开发的操作系统为:Windows、Linux。由于Windows系统为开发者广泛使用的,这里将在Windows上的安装环境的搭建步骤简要介绍如下:
step1 搭建开发环境
1) 配置JDK环境,编者采用的版本是jdk1.6.0_20,读者可以从Sun官网http://java.sun.com/javase/downloads/index.jps下载所需的版本;
2) 安装Eclipse Java IDE,编者采用的版本是Ecilpse3.4,读者可以从官网下载。
step2 导入SDK
1)  在Eclipse中建立你的Java工程。
2)将开发工具包中libs目录下的Msc.jar复制到新建工程的libs目录中。



3) 在Eclipse中选中工程,通过工具栏Project->Properties->Java Build Path->Libraries->Add JARS或ADD External JARS引入Msc.jar。



4)将SDK.\lib目录下库文件拷贝到工程根目录。



5)在你需要使用MSC服务的文件中导入相应的类。
例如:import com.iflytek.speech.SpeechRecognizer;
step3 功能添加
1)初始化

初始化后,下面将添加功能。

3 语音听写

主要指将连续语音快速识别为文字的过程,能识别通用常见的语句、词汇,不限制说法。
3.1 语音听写


3.2 音频流听写


3.3 上传下载用户词表
上传用户词表可以提高词表内词汇的识别率,也可以提高语义的效果,每个用户终端设备对应一个词表,用户词表的格式及构造方法详见《iFlytek MSC Reference Manual》UserWords类。


4 语音识别

语音识别,即语法识别,主要指基于命令词的识别,识别指定关键词组合的词汇,或者固定说法的短句。语法识别采用ABNF语法格式。具体详解:http://www.xfyun.cn/


5 语音合成

将文字信息转化为可听的声音信息,让机器像人一样开口说话。具体详解:http://www.xfyun.cn/index.php/services/online_tts

5.1 播放合成


5.2 无声合成

6 语义理解

6.1 语音语义理解
您可以通过后台配置出一套您专属的语义结果,详见http://osp.voicecloud.cn/。


6.2 文本语义理解
用户通过输入文本获取语义结果,专属语义结果和上述语音的方式相同。

7 附录

7.1 识别结果说明 


7.2 个性发音人列表
1)语言为中英文的发音人可以支持中英文的混合朗读。
2)英文发音人只能朗读英文,中文无法朗读。
3)汉语发音人只能朗读中文,遇到英文会以单个字母的方式进行朗读。


更多问题,请见:
http://www.xfyun.cn/doccenter/java

http://bbs.xfyun.cn/forum.php?mod=viewthread&tid=13040


  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值