智能(语音)对话系统架构研究

    本文所谈及的架构主要指使用已有的智能对话服务来搭建一个应用系统,而不会深入的探讨智能对话服务内部的架构。

智能对话系统的需求目标

    智能对话系统可以提供回答问题的能力,即在理解自然语言的基础上,解答用户提出的问题。进一步的,可以提供基于任务的对话能力,及判断用户的意图,通过多轮对话收集必要的信息,完成订票,查找音乐等服务。

智能对话系统的架构概览

    上图是阿里云智能对话平台文档中的智能语音交互系统架构图,从架构图中可以看到有以下重要的组件:

  • 用户端应用。用户直接使用的设备上的应用,如运行于浏览器的H5聊天应用,或者独立的APP。
  • 路由服务。
  • 智能对话。提供问答和对话服务的应用或SAAS平台。可以使用百度UNIT,或阿里云的智能对话服务。(2018/5/30 阿里云的智能对话服务最近在升级,新用户暂时无法使用)
  • 第三方内容服务。
  • 客户应用内容服务。
  • 客户管控台。客户管理控制智能对话服务的界面。企业客户可以在控制台中设置意图,训练、测试和发布自己的对话服务。

    以上的组件可以支撑和用户的文本对话能力,如果要和用户进行语音对话,还需要ASR和TTS组件。

  • ASR,Automatic Speech Recognition的简写,将人的语音转换为文本的技术。
  • TTS,Text To Speech的缩写,将文本转换为人的语音。先进的TTS技术输出的语音音律流畅,使得听者感觉自然。

参考资料

1. https://help.aliyun.com/document_detail/64541.html

  • 2
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值