MRCP 媒体资源控制协议

媒体资源控制协议(Media Resource Control Protocol, MRCP)是一种通讯协议,用于语音服务器向客户端提供各种语音服务(如语音识别和语音合成)。
    MRCP并不定义会话连接,不关心服务器与客户端是如何连接的,MRCP的消息通常是承载于其它协议之上,如RTSP,SIP等。
  MRCP消息使用类似于HTTP等许多Internet协议一样的文本格式,每个消息包括三部分:首行,消息头,消息体。首行表明消息类型及返回码等信息。消息头包括了若干行内容,每一行都形如 "字段名:数值"。消息体包括了消息的详细内容,长度在消息头中指定。
  类似于HTTP,MRCP使用请求(通常由客户端发起)、响应模式。响应可以简单的确认请求,或者给出关于处理的其它信息。例如,MRCP客户端向服务端请求想要发送一些音频数据以进行处理(比如说语音识别),为此,服务端可以发送一个包含端口号的响应,因为MRCP并未定义音频数据的传输,所以,必须依靠其它的协议,比如说RTP来进行。
  有两个版本的MRCP协议,版本2使用SIP作为控制协议,版本1使用RTSP。
  [1]RFC4463: A Media Resource Control Protocol (MRCP)
1、  MRCP协议概述
     媒体资源控制协议(Media Resource Control Protocol,MRCP)是由Cisco、Nuance等公司联合开发的网络协议,该协议由IETF作为Internet草案发布(draft-shanmugham-mrcp-07)。该协议为那些需要进行语音处理的客户端提供了一种通过网络来控制媒体处理资源(如ASR、TTS引擎等)的机制。该协议在设计之初就考虑了可以在将来得到扩展以支持声纹鉴别和身份识别(Speaker Identification/Speaker Verification)等功能。 
     MRCP协议定义了控制媒体处理资源所必需的请求(Request)、应答(Response)和事件(Event)等消息。MRCP协议也为每一种资源定义了状态机,为每一个请求和服务器事件定义了所需的状态转换。MRCP关注的焦点在于控制那些进行媒体流处理的资源(如ASR、TTS),以及如何与这些资源之间进行通讯。 
     MRCP协议不能独立工作,它依赖于RTSP(Real Time Streaming Protocol)作为载体在客户端与服务器端之间建立会话连接。而语音媒体数据则通过RTP(Real Time Transport Protocol)协议连接传送给语音应用服务器。
    典型的基于MRCP的分布式语音应用系统采用C/S架构,由客户端发出媒体流处理请求,服务器端则利用媒体处理资源(ASR/TTS)来处理或生成媒体流,并将相应的处理结果返回给客户端。这样客户端就可以通过MRCP协议来通过网络分布式地控制服务器端的媒体处理资源。
    随着MRCP协议的不断推广与应用,各语音技术厂商在实践与部署过程中碰到了各种各样的问题。为此,IESG(The Internet Engineering Steering Group)于2002年特许成立了Speechsc工作组,专门负责起草更加完善高效的支持分布式语音资源处理的开放协议。在Speechsc工作组的努力下,改进后的MRCPv2(draft-ietf-speechsc-mrcpv2-09)很快应运而生了。MRCPv2的消息格式和资源状态机等都建立在MRCP协议版本1的基础之上,它完全兼容W3C的SSML、SRGS、NLSML标准。与MRCPv1不同的是MRCPv2消息不再依赖RTSP作为载体,而是作为独立的消息进行传输,但是它仍依赖于会话管理协议,如SIP(Session Initiation Protocol)协议,来在客户端与服务器端之间建立控制会话。 
 
2、  MRCP发展概况
     在传统的语音应用中,各集成商必须针对不同的ASR/TTS厂商提供的API接口进行专门的集成开发,不同ASR/TTS引擎的接口各不相同,从而导致了集成过程的复杂性和局限性。而利用MRCP协议提供的标准接口,语音集成开发商们不必再针对特定的ASR/TTS进行开发,而只需要提供统一的MRCP接口。利用这个特性,他们甚至可以在同一个应用系统中集成不同厂商的ASR/TTS引擎,譬如为了提供多语种语音合成服务,他们可以采用多个不同厂商的TTS。这样就为各种语音应用开发提供了更加灵活的选择,并有效地降低业务开发周期和成本。
    正是由于具有以上优势,MRCP协议在推出以后得到了国外各主流语音技术提供商的广泛支持。作为MRCP协议的合作起草者,Nuance和Cisco公司已经在多个语音应用解决方案中证明了该协议的效力。目前国外几乎所有的主流语音技术供应商都已经宣布推出基于MRCPv1的产品:
● 语音资源供应商:Acapela、BBN、IBM、Loquendo、Nuance(ScanSoft)、Rhetorical、Telisma等;
● 板卡技术供应商:Intel、NMS、Aculab等;
● 语音技术应用集成商:Cisco、Nortel、Lucent、HP、Edify、Genesys、Intervoice、SER、Unisys、Convedia等。 
    随着通信技术的进一步发展,下一代电信网络(NGN)将是以宽带IP、宽带无线网络、光网络、软交换为技术支撑,广泛结合CTI应用的融合网络,原有的电信网络将更加开放化,接口协议趋于标准化。SIP协议和RTP协议将逐步成为VoIP和软交换技术中承载会话控制和媒体传输的核心协议。而基于SIP和RTP协议设计的MRCPv2将会在分布式语音资源解决方案中逐步得到更大规模的应用。 


 
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值