灵犀云智能语音云平台产品白皮书(摘要)

灵犀云产品白皮书

本文档主要描述了中国移动智能语音能力平台灵犀云的基本功能,为初次使用灵犀云的开发者提供简要的入门信息。文档中提供了灵犀云平台的架构和功能介绍,但并不作为开发指南使用。

概述

灵犀云智能语音能力平台(下称“灵犀云”)是中国移动面向互联网开发者推出的智能语音应用开发交互平台,采用亚太地区最大的语音上市公司——科大讯飞研制的全球领先中文智能语音技术,免费向开发者提供语音合成、语音识别、语音听写等能力,为语音应用开发爱好者提供方便易用的开发接口,使各种应用的用户随时随地获得高质量的智能语音服务。


产品服务

基础服务

基础服务包括在线语音合成、在线命令词识别、语音听写、语义理解等。

在线语音合成

语音合成是指让文字转换为声音,让机器能够说话。灵犀云使用的InterPhonic语音合成系统是由科大讯飞推出的新一代文语转化引擎,采用最先进的中文文本、韵律分析算法和大语料库的合成方法,合成语音已经接近真人的自然效果。主要功能有:

1) 高质量语音,将输入文本实时转换为流畅、清晰、自然和具有表现力的语音数据;
2) 多语种服务,整合了多语种语音合成引擎,可提供中文、中英文混读、纯正英文、粤语、粤英文混读的语音合成服务;
3) 多音色服务,提供丰富、风格多样化的音色选择,如浑厚淳正的男声,温柔甜美的女声,标准地道的英语男女声等等,所有音色库均继承科大讯飞语音合成技术一贯的优良品质。用户可供根据不同应用业务需要,选择最适合应用场景的语音风格,并支持实时动态的音色切换;
4) 高精度文本分析技术,保证了对文本中未登录词(如地名)、多音字、特殊符号(如标点、数字)、韵律短语等智能分析和处理;
5) 多字符集支持,支持输入GB2312、GBK、Big5、Unicode和UTF-8等多种字符集,普通文本和带有CSSML标注等多种格式的文本信息;
6) 多种数据输出格式,支持输出多种采用率的线性Wav,A/U率Wav和Vox等格式的语音数据;
7) 提供预录音合成模板,对合成文本中符合语音模板固定成分的文本使用发音人预录语音,非固定成分使用合成语音。这种方法有利于改进定制领域合成效果,简化定制流程,加快定制速度,同时也使得预录音的使用更自然、更灵活,满足更广泛的应用需求;
8) 语音调整功能,开发接口提供了音量、语速、音高(基频)等多种合成参数动态调整功能;
9) 配置和管理工具,合成引擎提供了统一进行配置和管理的工具,完成了全局参数配置、用户词典、用户规则、定制资源包管理等功能;
10) 效果优化,合成引擎提供了以定制资源包和CSSML为代表的多种针对实际应用环境进行合成效果优化的方法;
11) 一致的访问方式,能以C/S方式访问远程的语音合成服务,并且提供与本地调用相同的开发接口,实现了完全透明的访问;
12) 背景音和预录音,提供了背景音和预录音的功能,大大提高了合成语音的自然度和表现力。

在线命令词识别

语音识别是指把声音转换成文字,让机器能够听懂人类的声音。灵犀云采用科大讯飞的InterReco语音识别系统为自助语音服务提供关键字语音识别和

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1 产品简介...........................................................................................................................4 2 产品功能...........................................................................................................................4 电话号码语音输入....................................................................................................... 4 电台号码语音输入....................................................................................................... 5 非特定人语音标签....................................................................................................... 5 为中国人设计的英文识别...........................................................................................5 支持中文、英文、中英文混合识别 ........................................................................... 5 支持句式功能............................................................................................................... 6 对符号、中文姓氏智能判断 ....................................................................................... 6 同音字识别................................................................................................................... 6 支持动态识别命令词................................................................................................... 6 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 2.12 2.13 3 联系我们...........................................................................................................................8

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值