搜索智能问答的探索与实践

搜索智能问答的探索与实践

搜索引擎的演化历程

搜索智能问答的探索与实践
搜索引擎的演化历程

在这里插入图片描述
搜索中的问题需求
在这里插入图片描述
搜索中的问答形态
在这里插入图片描述
搜索中问答的技术路线
在这里插入图片描述
KBQA
什么是KBQA

在这里插入图片描述
解决方案
方案一:结构化推理

基于组合范畴语法 (CCG) 或句法依存树解析Query结构,并将其以固定的规则转换为图引擎表达式

方案二:结果端到端

基于神经网络,一站式完成从原始文本的输入到图引擎表达式/查询语 句的输出
在这里插入图片描述
方案选择

在这里插入图片描述

Query解析:模板挖掘
基于种子SPO,从多方数据来源挖掘模板

在这里插入图片描述
Query解析:层次化模板匹配
简单识别,与多层次嵌套模板识别
在这里插入图片描述
Query解析:模型预测
使用轻量且精准的模型兜住模板未能覆盖的10%的用户表达
在这里插入图片描述
结构化推理:算子引擎
算子的无限种组合,可以解决搜索场景下绝大多数复杂问题
在这里插入图片描述
DeepQA
DQA解决什么问题
背景:

DeepQA是指深度挖掘自由文本内容,结合QP匹配和MRC等技术,从自由文本中抽取文本片段作为答案,从而产出高质量问答对,扩充线上FAQ库,提升问答整体覆盖率。

特点:

来源简单 数据丰富 广泛适配多数场景

难点 如何从中抽取正确的答案?
在这里插入图片描述
搜索场景下的DQA
在这里插入图片描述
问答Query的理解
在这里插入图片描述
Query意图据识模型

在这里插入图片描述
在这里插入图片描述
MRC模型优化
在这里插入图片描述
MRC数据强化
在这里插入图片描述
答案选择与排序
答案选择排序

•答案聚合:多来源多文档下,同答案聚合,提升信号强度

•答案排序:选取基础Q-T-P-A四元组基础字面匹配特征、MRC模型特征、语义类特征等,做多维信号融合打分排序

据识后置

• MRC据识:MRC模型面临大量负样 本,过召回问题收敛难度大,过度 收敛会导致召回变低

• 后置据识:通过后置多维度融合后 的分数,对答案进行进一步据识, 降低过召回情况
在这里插入图片描述
方案的效果
Motian预训练 + MRC + rank 取得 CLUE-CMRC 榜单 Top1

在这里插入图片描述
IRQA
IRQA需要做哪些事情

在这里插入图片描述
匹配:相关性计算模型
在这里插入图片描述
预训练模型应用

在这里插入图片描述
大模型加速
在这里插入图片描述
一些思考
IRQA对内容生态的依赖、TOP1&SEO的互利结合
DQA事实的支撑、 KB完备性、KB的联合
更全面的应用

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值