Java语音程序开发用户指南

1 概述

本文档是开发科大讯飞Java语音程序的用户指南,定义了语音听写、语音识别、语音合成以及语义理解相关接口的使用说明和体系结构,如图1所示。




科大讯飞语音功能抢先体验:

http://www.xfyun.cn/default/online_demo

2 预备工作

支持Java平台开发的操作系统为:Windows、Linux。由于Windows系统为开发者广泛使用的,这里将在Windows上的安装环境的搭建步骤简要介绍如下:

step1 搭建开发环境

1) 配置JDK环境,编者采用的版本是jdk1.6.0_20,读者可以从Sun官网http://java.sun.com/javase/downloads/index.jps下载所需的版本;
2) 安装Eclipse Java IDE,编者采用的版本是Ecilpse3.4,读者可以从官网下载。

step2 导入SDK

1)  在Eclipse中建立你的Java工程。
2)将开发工具包中libs目录下的Msc.jar复制到新建工程的libs目录中。



3) 在Eclipse中选中工程,通过工具栏Project->Properties->Java Build Path->Libraries->Add JARS或ADD External JARS引入Msc.jar。



4)将SDK.\lib目录下库文件拷贝到工程根目录。



5)在你需要使用MSC服务的文件中导入相应的类。
例如:import com.iflytek.speech.SpeechRecognizer;

step3 功能添加

1)初始化

初始化后,下面将添加功能。

3 语音听写

主要指将连续语音快速识别为文字的过程,能识别通用常见的语句、词汇,不限制说法。

3.1 语音听写



3.2 音频流听写



3.3 上传下载用户词表

上传用户词表可以提高词表内词汇的识别率,也可以提高语义的效果,每个用户终端设备对应一个词表,用户词表的格式及构造方法详见《iFlytek MSC Reference Manual》UserWords类。


4 语音识别

语音识别,即语法识别,主要指基于命令词的识别,识别指定关键词组合的词汇,或者固定说法的短句。语法识别采用ABNF语法格式。具体详解:http://www.xfyun.cn/


5 语音合成

将文字信息转化为可听的声音信息,让机器像人一样开口说话。具体详解:http://www.xfyun.cn/index.php/services/online_tts

5.1 播放合成


5.2 无声合成


6 语义理解

6.1 语音语义理解
您可以通过后台配置出一套您专属的语义结果,详见http://osp.voicecloud.cn/。


6.2 文本语义理解

用户通过输入文本获取语义结果,专属语义结果和上述语音的方式相同。

7 附录

7.1 识别结果说明 



7.2 个性发音人列表

1)语言为中英文的发音人可以支持中英文的混合朗读。
2)英文发音人只能朗读英文,中文无法朗读。
3)汉语发音人只能朗读中文,遇到英文会以单个字母的方式进行朗读。


更多问题,请见:

http://www.xfyun.cn/doccenter/java

http://bbs.xfyun.cn/forum.php?mod=viewthread&tid=13040


阅读更多 登录后自动展开
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页