word2vec应用场景_“猜心思”的Hard模式:问答系统在智能法律场景的实践与优化...

本文介绍了检索型问答系统在智能法律场景中的落地实践,包括双塔型架构、注意力机制和比较汇总架构等模型。作者分享了优化过程,如使用句子改写、q2q_bert和q2a_bert模型,以及未来改进方向,如结合意图识别和上下文。
摘要由CSDN通过智能技术生成

作者徐亮,实在智能算法专家,在深度学习、文本分类、意图识别、问答系统方面有非常深入的研究和创新。点击文末“阅读原文”直达原文链接,欢迎投稿,AI、NLP相关即可。


导读:问答系统是自然语言处理领域一个很经典的问题,它用于回答人们以自然语言形式提出的问题,有着广泛的应用。例如其应用场景有:智能语音交互、在线客服、知识获取、情感类聊天等。常见的分类有:生成型、检索型问答系统;单轮问答、多轮问答系统;面向开放领域、特定领域的问答系统;完成任务型、纯聊天型的问答系统。本文介绍的主要是我们在检索型、面向特定领域的问答系统,在落地过程中的尝试与思考。我们首先会简要的回顾一下检索型问答系统的框架、学习过程、常见模型。

业界做法

问答系统的核心:构建知识库,识别用户意图,匹配知识库

咨询问答的业界做法:

1. 从以往的数据中,通过数据挖掘方式(聚类、关键词),得业务中的高频问题

2. 从将高频的问题提炼出标准问题

3. 业务专家给标准问题配上标准答案

4. 上线后持续挖掘用户问题,将新的问题加入到知识库中。

a682564800eb804061bdc7bb9f7c7b51.png

01

框架:

问题—>

问题分析后得到查询(query)—>

搜索引擎召回—>

模型排序后选出答案

231d5623209e8b2d13b3201e642dadb5.png

一、学习方式

给定一个问题和一系列候选项,任务的目标是,找到能回答问题的正确的答案。

(1) 转化为二分类学习问题(pointwise)

输入:

497dd78fa281aad6e35394ff3b219307.png

输入是一个(问题,候选问题,标签)

一个问题,对应正确的答案,标签为1;对应其他的答案,标签为0

66b41ef69ed0672790c6335720a93c6b.png

训练:

学习到一个函数,当给定一个问题和一个候选答案时,能正确的预测出答案。

61716361eaeafe9d3b3ed79c5fa11a6e.png

预测:

给定一个问题和一系列候选答案,找到概率最高的答案,并将这个答案做为结果返回。

(2)转行为成对学习问题(pairwise即结合正例与负例)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值