搜索智能问答的探索与实践

最新推荐文章于 2023-10-22 19:42:12 发布

Necther

最新推荐文章于 2023-10-22 19:42:12 发布

阅读量1.1k

点赞数

分类专栏：自然语言处理文章标签：智能问答人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011983997/article/details/122645248

版权

自然语言处理专栏收录该内容

69 篇文章 6 订阅

订阅专栏

搜索智能问答的探索与实践

搜索引擎的演化历程

搜索智能问答的探索与实践
搜索引擎的演化历程

在这里插入图片描述
搜索中的问题需求

搜索中的问答形态

搜索中问答的技术路线

KBQA
什么是KBQA

解决方案
方案一：结构化推理

基于组合范畴语法 (CCG) 或句法依存树解析Query结构，并将其以固定的规则转换为图引擎表达式

方案二：结果端到端

基于神经网络，一站式完成从原始文本的输入到图引擎表达式/查询语句的输出
在这里插入图片描述
方案选择

在这里插入图片描述

Query解析：模板挖掘
基于种子SPO，从多方数据来源挖掘模板

在这里插入图片描述
Query解析：层次化模板匹配
简单识别，与多层次嵌套模板识别

Query解析：模型预测
使用轻量且精准的模型兜住模板未能覆盖的10%的用户表达

结构化推理：算子引擎
算子的无限种组合，可以解决搜索场景下绝大多数复杂问题
在这里插入图片描述
DeepQA
DQA解决什么问题
背景：

DeepQA是指深度挖掘自由文本内容，结合QP匹配和MRC等技术，从自由文本中抽取文本片段作为答案，从而产出高质量问答对，扩充线上FAQ库，提升问答整体覆盖率。

特点：

来源简单数据丰富广泛适配多数场景

难点如何从中抽取正确的答案？
在这里插入图片描述
搜索场景下的DQA

问答Query的理解

Query意图据识模型

在这里插入图片描述

MRC模型优化

MRC数据强化

答案选择与排序
答案选择排序

•答案聚合：多来源多文档下，同答案聚合，提升信号强度

•答案排序：选取基础Q-T-P-A四元组基础字面匹配特征、MRC模型特征、语义类特征等，做多维信号融合打分排序

据识后置

• MRC据识：MRC模型面临大量负样本，过召回问题收敛难度大，过度收敛会导致召回变低

• 后置据识：通过后置多维度融合后的分数，对答案进行进一步据识，降低过召回情况
在这里插入图片描述
方案的效果
Motian预训练 + MRC + rank 取得 CLUE-CMRC 榜单 Top1

在这里插入图片描述
IRQA
IRQA需要做哪些事情

匹配：相关性计算模型

预训练模型应用

在这里插入图片描述
大模型加速

一些思考
IRQA对内容生态的依赖、TOP1&SEO的互利结合
DQA事实的支撑、 KB完备性、KB的联合
更全面的应用

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。