vxml

VoiceXML(Voice Extensible Markup Language)是一种用于创建交互式语音对话系统的标记语言,广泛应用于电话自动服务系统中。它允许开发者设计自然语言菜单系统,让用户通过语音与服务器进行交互。本文将深入探讨VoiceXML的基本概念、语法结构以及如何在不同平台上集成和部署,包括Motorola解决方案。了解VoiceXML,能提升电话服务的用户体验并优化企业后台流程。
摘要由CSDN通过智能技术生成
这篇文档详细描述了VoiceXML,即语音扩展标记语言。第一章介绍它的背景、基本概念和用途;第二章介绍form的对话框结构(dialog constructs)、menu、link和它们的解释机制FIA(Form Interpretation Algorithm);第三章介绍用户的DTMF(Dual Tone Multi-Frequency)和语音输入用到的语法;第四章介绍系统输出用到的语音合成和预先录制的音频;第五章介绍对话框(Dialog)流程的控制,包括变量、事件和可执行元素;第六章介绍各种环境特性,例如参数(Parameter)、属性(Property)和资源处理;附录提供了包括VoiceXML计划、FIA(Form Interpretation Algorithm)、音频文件格式等附加信息。
 
     VoiceXML最早出现于1995年,作为一种基于XML对话的设计语言,它的出现是为了简化AT&T一个名为PML(Phone Markup Language)项目中语音识别程序的开发过程。经过AT&T的重新组织,AT&T,Lucent and Motorola的开发团队继续致力于开发他们的类PML语言。
 
     1998年,W3C主办了一次关于语音浏览器的会议。此时,AT&T and Lucent对于最开始的PML都有各自不同的发展,Motorola开发了VoXML,IBM正在开发它自己的SpeechML。此次会议的其他与会者也正在开发类似的语言,例如HP的TalkML和PipeBeach的VoiceHTML。
 
     于是AT&T、IBM、Lucent和Motorola共同组织了VoiceXML论坛,它的任务是定义一种标准的对话设计语言,使开发者可以用它来创建会话式的应用程序。他们选择XML作为他们工作的基础,因为他们很清楚,XML是技术发展的趋势。
 
     在2000年,VoiceXML论坛发布了VoiceXML 1.0。此后不久,VoiceXML 1.0被提交给W3C(World Wide Web Consortium)作为一种新的国际标准。VoiceXML 2.0就是W3C的成员单位、其他的W3C工作组和公众的共同努力的结果。
 
     熟悉VoiceXML1.0的开发者可直接到附录,那里总结了VoiceXML2.0和VoiceXML1.0的差别。
 
第一节 介绍
 
     VoiceXML是用来创建音频对话的,主要包括语音合成、数字化音频、语音识别、DTMF按键输入识别、录音、通话、混合主动式会话。它的主要作用是把基于网络的开发和信息这两者的优势引入语音应答系统。
 
     这里有两个简短的例子,第一个例子是“Hello World”:
 
       <?xml version="1.0" encoding="UTF-8"?>
       <vxml xmlns="http://www.w3.org/2001/vxml"
            xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
              xsi:schemaLocation="http://www.w3.org/2001/vxml
                http://www.w3.org/TR/voicexml20/vxml.xsd"
                 version="2.0">
         <form>
           <block>Hello World!</block>
         </form>
       </vxml>
 
     最上层的元素是<vxml>,它主要是作为dialog的容器。在VoiceXML里有两种dialog:form和menu 。form用来输出提示信息和收集输入信息,menu提供一些choice,以决定下一步要做什么。这个例子里有一个form,它包含了一个block,这个block把“Hello World!”合成语音,并输出给用户。由于这个form没有指定下一个dialog,因此,这次会话结束。
 
     第二个例子要求用户选择一种饮料,然后把它提交给服务器端的一个脚本。
 
       <?xml version="1.0" encoding="UTF-8"?>
       <vxml xmlns="http://www.w3.org/2001/vxml"
            xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
              xsi:schemaLocation="http://www.w3.org/2001/vxml
                http://www.w3.org/TR/voicexml20/vxml.xsd"
                 version="2.0">
         <form>
          <field name="drink">
            <prompt>Would you like coffee, tea, milk, or nothing?</prompt>
            <grammar src="drink.grxml" type="application/srgs+xml"/>
          <block>
            <submit next="http://www.drink.example.com/drink2.asp"/>
          </block>
          </field>
         </form>
       </vxml><
找了很久的VoiceXml开发工具,小巧而实用,由华为开发,希望对大家有用。   VoiceXML是建立于XML 语言规范基础之上,是一种应用于语音浏览的标记语言。利用VoiceXML可以建立基于WEB的语音应用和服务。本文简要描述了VoiceXML规范及相关术语,并给出了一种基于VoiceXML的语音与数据集成模型,它主要由语音浏览器、语音识别、语音合成和VoiceXML网关等部分组成。应用该模型,可以方便地建立各种基于WEB的语音应用系统。随着电子商务、客户服务等信息服务的普遍化,交互式语音应答系统(IVR ,Interactive Voice Response)在各种商业系统中的应用越来越广泛。然而这种语音交互方式存在以下缺点:(1)移植性、灵活性差;(2)在实际系统上做应用开发的难度很大,特别是涉及到话音流程的编写及调试问题;(3)无法综合利用现在的WEB资源。而将IVR系统Internet化,可以增加系统可重用的机会,降低成本,这必将成为今后语音应用的一种主要趋势。另一方面,到目前为止,人们从Internet获取各种资源时,还只能是借助计算机来实现。而实际上,电话具有比计算机更高的普及率,如果允许人们通过电话来访问Internet的资源,那么这对于Internet的应用发展必将是一次质的飞跃。在这类应用前景的驱动下,VoiceXML 标准被提出来了,它是由World Wide Web Consortium (W3C)制定的。利用这种技术,用户可以通过电话按键或语音来访问Internet上的各种资源,它是语音浏览技术以及语音互联网的核心。与XML标准类似,VoiceXML是一种基于文本的语言,它只定义了数据的存取方式,用户必须编写程序,以便能解释、生成、传送VoiceXML文档。 VoiceXML为语音应用领域展现了一个广阔的未来,在语音门户、语音呼叫中心(Call Center) 、语音信息服务、语音电子商务等领域有着广泛的应用。而这些应用或服务可以很容易地和原有的数据系统结合起来,甚至可以轻易地从原有的各类应用中延展出来。使用VoiceXML的应用系统中,不要求用户学习复杂的高级语言,就可灵活扩充新业务。而无需再与开发商联系,重新定制开发,只需要编写几个 VoiceXML页面就可以实现新的业务流程。而且编制好的VoiceXML脚本可以随时随地加入到系统中,而不会影响系统的正常运行。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值