php即时通讯中语音实现_智能语音机器人中对话管理系统设计与实现

本文介绍了58集团TEG架构平台线AI Lab的智能语音机器人,特别是其在电话场景下的对话管理系统。对话管理包括自然语言理解(NLU)和对话管理器(DM),NLU负责识别用户意图和槽位,DM依据用户动作和话术配置生成回复。对话管理器通过对话策略处理通用意图、标准问题,并在低语音质量下保持对话流畅。
摘要由CSDN通过智能技术生成

ffaeae88a311aa7780d546fc82119e86.gif

背景

智能语音机器人是58集团TEG架构平台线AI Lab自主研发的具有自动电话拨打、多轮语音交互、智能意向判断等多种功能的通用对话机器人。在电话拨打场景下,多轮语音交互要求具备内容的专业性和极高的流畅性,目前多轮语音交互主要由话术驱动。当前智能语音机器人已经接入多个不同的业务场景,不同的业务场景定制了多套不同的话术。让智能语音机器人在复杂且多样的话术上与用户流畅的交流,是智能语音机器人所面临的困难与挑战。

智能语音机器人总体架构(参考 智能语音机器人架构实践),核心模块主要包括语音通话模块(参考 智能语音机器人中的语音通话实践)、意图识别模块、对话管理系统等,本文主要介绍对话管理系统的实现。

简介

在业界,对话管理系统经常出现在任务型对话中,指的是结合意图、槽位识别结果和系统配置生成系统回复,系统配置的实现形式通常是有限状态机或特殊的语境机制,用于实现多轮对话功能。一般任务型对话在客服场景中出现的比较多,如:订机票、天气查询等,旨在解决用户的需求。

电话拨打场景下的智能语音机器人与智能客服的最大区别在于主动性和流畅性。智能语音机器人是主动向用户发起对话,而不是等待用户提出需求,对话通常有明确的目的性,如:销售、通知、回访等,需要根据固定话术发起通话。另外,电话拨打场景对通话流畅性的要求很高,需要有效处理用户的口头语和临时提出的一些问题,并引导用户完成话术中的内容。因此,智能语音机器人的多轮交互是话术驱动的,且需要有效的支持电话场景下的特殊行为。

话术是业务方创建的对话流程图,其结构可以简单的概括为主线话术、支线话术、通用话术和标准问题话术。主线为话术主要目的,由开场白开始发起通话,其他话术是为了应对通话过程中其他行为(参考 智能语音机器人架构实践)。下图为招聘场景下的话术示例。

4c972b64efec188670e74d0da7825fbf.png

对话管理系统根据用户意图、槽位等信息决定话术的下一个节点,给出回复,并结合通用意图、标准问题以及拉回策略等,提高对话流畅度。下图为招聘和黄页两个场景下的对话过程。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值