DuerOS春季沙龙:协议与接口的深入浅出

阳春三月,不用去看“江南草长”,四环路边的花都开了。


640?wx_fmt=jpeg

若干年前的北大西南门早已消失在了四环路边,曾经的海淀图书城变成了现在的创业大街。周六的下午,在百度的创新体验中心,举办了DuerOS 核心开发者的交流活动。

640?wx_fmt=jpeg

本次活动涵盖了DBP平台的运营重点和激励方式,产品交互的设计要点,技术讨论和投融资服务四个部分,我主要完成技术部分的分享,现概要如下:

640?wx_fmt=jpeg

原来准备讲一些技能开发中的进阶内容,但考虑到合作伙伴的侧重点不同,为了覆盖更多的开发者,最终选择了对DuerOS的协议解读。


640?wx_fmt=jpeg

这是已经上市小度系列智能音箱,不同价位,从无屏到有屏,而且还在不断的演进中。


既然都是人工智能音箱了,那为什么还要在智能音箱上开发技能服务呢?对于这一问题,可以用智能手机的类比来反问。既然都是智能手机了, 那为什么要开发APP呢?


640?wx_fmt=jpeg

通过DuerOS Bot Platform (DBP)就可以在基于DuerOS的设备上开发技能服务,详情可以参见“面向接口/协议?看DuerOS的技能开发”。技能服务开发的基本原理如下:


640?wx_fmt=jpeg

技能开发就是一个web服务,如果把智能音箱当作浏览器,DuerOS 将自然语言的交互变成了类似浏览器上的键盘/鼠标输入,而对于后台服务而言,技能服务几乎没有什么变化。


640?wx_fmt=jpeg

面向接口/协议?看DuerOS的技能开发”中主要谈到了DBP协议,而DuerOS中主要有3类应用协议:设备配网协议、从设备到DuerOS的协议DCS和 DBP协议。

640?wx_fmt=jpeg

传输协议主要满足数据装载,多路复用,差错和流控。DuerOS中的传输协议是http/https,需要注意的是,DCS中的传输协议大多是HTTP/2,使用了其中的长连接特性,具体可以参见《温故知新,HTTP/2》。


640?wx_fmt=jpeg

技能服务的典型构建可以基于有限状态机,其中launchRequest是对话入口,IntentRequest和Event构成消息循环,SessionEndRequest是对话的退出点,从构成一次多轮对话的生命周期。

HTTP中的Request 中包含多个对象,主要如下:

640?wx_fmt=jpeg

其中Context是一个非常重要的字段,不仅包含了AudioPlayer和VideoPlayer的播放状态信息,而且在system字段中包括了用户的信息和服务技能分相关信息,针对Device设备信息可以面向不同的终端设备完成不同业务逻辑的定制。

640?wx_fmt=jpeg

Response 是开发者业务逻辑完成后,返回给DuerOS设备的数据。关于Context中的Intent,可以参见《感知自然语言理解(NLU)》一文。


ExpectResponse 是一个非常需要关注的字段,有效地使用ExpectResponse 可以显著的提高用户的对话体验。


ShouldEndSession也要注意,除非明确肯定要退出的情形,一般都要设置为False。


Session 相当于浏览器中的Cookie,技能服务可以向Session中设置数据,这样的数据就可以往返于技能服务和DuerOS 之间了。


从数据的类型上分类,技能服务和DuerOS 之间传输的数据主要有三种消息类型:


640?wx_fmt=jpeg


事件来自基于DuerOS的设备,指令从技能服务发往基于DuerOS的设备,而服务接口主要是DBP平台为技能服务提供的web接口。事件大致可以分为4种:

640?wx_fmt=jpeg

在开发技能服务的时候,需要对这些事件进行处理,而且要结合具体的应用场景。


相应地,指令可大致可以分为4类:

640?wx_fmt=jpeg

这里列出了主要的事件和指令,DBP协议具有极强的可扩展性,需要注意官网上的更新。


服务接口是一个比较宽泛的分类,技能服务可以有私有的服务接口,第三方服务的web接口,百度云服务的接口以及DBP 提供的服务接口。

640?wx_fmt=jpeg

这里主要描述了DBP当前提供的服务:

640?wx_fmt=jpeg

DBP 在持续推出接口服务,为开发者提供更加有吸引力的功能,例如:

  • 连接家用打印机

  • 从技能发往设备终端/智能终端伴侣的推送消息

  • 通过智能终端完成录音/录像的能力

  • 电话通知服务


这些个性化的接口和服务一般都需要用户的授权:

640?wx_fmt=jpeg

完成用户的授权之后,不但可以使用这些接口服务,还可以对用户的身份进行ID映射,从而形成用户系统的贯通,进而完成一些面向用户的个性化服务。


另外,DBP 中对IoT协议有特殊的支持,目前的类型有智能家居、车载设备和机器人。

640?wx_fmt=jpeg

目前的IoT主要还是面向云对接,通过授权后发现设计,建立连接进而控制和查询设备,以及设备的属性上报等。


640?wx_fmt=jpeg

由于时间有限,分享的内容还主要集中在概要的层面,希望能用尽量通俗的语言描述面向DuerOS的技能开发。


会后的讨论更有意思,大家聊到了SSML,探讨了对话树的构成以及其他工具化开发对技能开发效率的提升。


士不可以不弘毅,任重而道远。 希望涌现出更多优质技能,让基于DuerOS的设备给人们带来更多的乐趣,陪伴我们的生活,陪伴你我。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值