文献记录 - AliMe Chat: A Sequence to Sequence and Rerank based Chatbot Engine

文献地址:

https://www.aclweb.org/anthology/P17-2079.pdf

主要内容:阿里小蜜对话机器人的介绍,开放域生成式的模型。基于IR和Seq2Seq的综合结果对给出问题的回答。

摘要

基于IR技术和Seq2Seq的综合结果对接近对话问题,并且已经在投入真实使用。

介绍

本论文的对话机器人服务大量的电子商务顾客,为了更好的体验,提供了开放域的对话系统。

常见的QA技术有基于IR和基于生成模型的,其中IR匹配在处理长句上效果不佳,生成模型可能会生成无意义的答案。

所以本论文综合这两种算法来缓解两种算法的问题

生成模型重排策略

在这里插入图片描述

当系统收到一个问题之后,会进入两个途径,一个是基于KBQA和IR的匹配系统,另一个是生成模型的回答。如果IR匹配的结果的相似度大于一个阈值T,那么就输出这个结果,否则,就输出Seq2Seq的结果。

在这里插入图片描述

这里的生成模型使用的是GRU的Seq2Seq模型,数据是淘宝对话中紧邻的问答对。

在这里插入图片描述

上图是IR模型和生成模型的融合形式,当bm25相似度算出来的结果大于0.19的样本使用IR模型的结果,小于的话就使用生成模型的效果。

在这里插入图片描述

效果图。

结论

综合IR搜索引擎(这里就是逆排序+BM25)和生成模型的问答。并经过线上测试的考验。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值