所谓对话式AI,就是机器可以进行类似人类的对话,通过捕获上下文并提供智能的应答。机器听懂了你的需求,并给了一个回答,与Siri只能一问一答不同的是,对话式AI实现了多轮对话与交流。
那么对话式AI如何听懂了你的需求,并给出回答?
首先,机器将用户说出的语音转换为文本;然后理解文本的含义,根据文本上下文语义在设置好的知识库里搜索能够提供的最佳应答;最后使用文本转语音工具将准确答案读给用户听。这个过程中,应用到了ASR语音转写、NLP自然语言处理、知识图谱、机器学习等技术及算法。
一、概念及分类
1. 产品概念
智能对话系统是自然语言处理、人工智能和机器学习等技术融合的产物,它允许人们通过语音、文本与机器人进行交流,而机器人基于语音识别、自然语言理解、自然语言生成、语音合成等技术,对用户进行应答。
广义的智能对话系统,包括消费硬件类产品和对话AI产品,本文将介绍对话AI产品。
对话AI产品:将智能对话系统加载在服务场景的对话式AI产品中,以文本、语音和多模态数字人等产品形式与终端用户交互,应用在客服、营销与泛交互等服务场景。
2. 产品分类
1)产品定位分类
对话式AI产品按照产品定位的不同可分为替代类对话AI产品、辅助类对话AI产品。
- 替代类对话AI产品:即对话式AI产品的替代性功能,可替代人类完成咨询应答、业务办理、营销推荐和智能外呼等任务,主要包括文本机器人、语音机器人、虚拟数字人。
- 辅助类对话AI产品:即对话式AI产品的辅助性功能,包括对人工工作流程的引导、对话监测、对话洞察、对话引导。主要产品包括坐席助手、会话分析两类产品。
2)功能分类
对话式AI产品按照功能角度可以分为问答型、任务型和闲聊型。
①问答型
通常为访客期望就自己提出的问题,机器人能给出相应的专业解答,表现为一问一答的形式。机器人相当于一个“知识顾问”,做“答疑解惑”的事情。常见的有FAQ、基于知识图谱的问答(KBQA)、表格问答(Table QA)和文档问答(Passage QA)等。FAQ检索型问答是根据用户的Query,匹配FAQ知识库最合适的答案并反馈给用户。