什么是对话式操作系统
- 以智能IoT设备(如智能音箱)为依托平台的操作系统
- 在这个操作系统上,开发者可以进行应用程序的开发
对话式操作系统的请求流程
以百度的DuerOS为例:
- 用户发出语音指令
- 智能音箱收集音频流
- 语音识别,将语音转化为文本
- 文本请求在系统内转化为请求指令,发送给对应的应用服务
- 应用服务处理请求,生成回复
- 语音合成,将应用服务的回复结果以音频形式输出
与传统web服务的区别
键盘和鼠标对浏览器进行输入操作,网站对输入的指令进行回复。
对话式操作系统中的技能服务,就类似于浏览器中的不同功能网站,也类似于手机操作系统上的各种APP。
对话式操作系统的相关思考
- 需要以AI技术为基础,理解人类的语言指令
- 交互形式和传统的屏幕交互差别很大
- 应用层技能服务的反馈形式也需要是语音形式,而不是传统的在屏幕画面上显示
- 在流程设计上,为了能让应用的步骤清晰,需要设计者做对应的安排(比如遇到网络延迟和处理中的情况,用户没有屏幕看在缓冲中,那怎么让客户知道应该等待下去)
- 人类是视觉动物,如何让对话式的交互可以更好的为人接受将是一个很大的挑战
- 应用服务的切换和并行处理也将是值得思考的方面