KGQA概览

本文介绍知识图谱问答(KGQA)的基本概念,包括符号定义、三元组构成及语义解析过程。强调了从自然语言问题到形式化查询语言转换的重要性,并通过实例展示了这一流程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

符号说明

符号说明备注
E \mathcal{E} E所有实体的集合
L \mathcal{L} L所有literal值的集合三元组(姚明,身高,2.26m)中的2.26m就是literal,它不算实体。
P \mathcal{P} P所有关系的集合关系既可以是连接两个实体的关系,如国籍,也可以连接实体和literal之间的关系,如上一行所示。
t t t t ∈ E × P × ( E ∪ L ) t\in \mathcal{E}\times\mathcal{P}\times(\mathcal{E}\cup\mathcal{L}) tE×P×(EL) t t t代表一个事实三元组,三元组指的就是(实体,关系,实体(或者是literal))
K \mathcal{K} K所有三元组的集合 K \mathcal{K} K就是知识图谱
q q q自然语言表达的句子也就是用户的query
A \mathcal{A} A所有答案的集合答案指的就是q对应的答案,包含三部分:(1)所有的实体、加上所有的literal;(2)所有聚集函数的计算结果;(3){True,False}。聚集函数的计算结果指的是形如:“成龙主演了多少部电影” 这句话,答案应该是sum成龙主演的所有电影(注:每一个电影在KG中是一个实体)。
F \mathcal{F} F所有的formal queries的集合formal query指的是形如SPARQL这种可以查询、操控知识图谱的语言。KGQA的做法就是将q解析成对应的formal query,进而从KG中找出答案
a ∈ A , f ∈ F a\in \mathcal{A},f\in \mathcal{F} aAfF单个答案、单个formal query举例:q=“What is the birthplace of Westworld’s writer?”,那么对应的SPARQL语句 f f f=“SELECT ?uri WHERE {?x ex:writer ex:Westworld.?x ex:bornIn ?uri}”,对应的答案 a a a=“Chicaga”。

语义解析(Semantic parser)

KGQA就是一个语义解析任务,将用户问题q解析成对应的formal query。

Full supervised vs weak supervised

Full supervised

完全监督形式的KGQA。完全监督指的是数据集中每一个样本包含三部分:(q、 f f f a a a),形如:
在这里插入图片描述

Weak supervised

弱监督形式下每一个q没有对应的 f f f

流程

如下图所示,测试集中的一个问题:“我是李小龙是哪一年出版的?”。
在这里插入图片描述
测试过程是对问题进行语义解析,找出实体I Am Bruce Lee和关系release year。然后到KG中找出三元组(I Am Bruce Lee,release_year, 2012),返回答案。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值