10-知识推理

最新推荐文章于 2023-09-24 14:39:13 发布

杰克船长有烦恼

最新推荐文章于 2023-09-24 14:39:13 发布

阅读量222

点赞数 1

分类专栏： cs224w图神经网络从零开始

本文链接：https://blog.csdn.net/m0_50976935/article/details/127014550

版权

cs224w图神经网络从零开始专栏收录该内容

16 篇文章 4 订阅

订阅专栏

图机器学习（知识推理）

1.前言

1. 主要思路

1.基本概念
2.单跳查询（问答）
3.多跳查询
4.在不完整的KG上进行路径查询（借鉴TransE）
5.联合查询
6.在不完整的KG上进行联合查询（使用Query2Box）
7.Query2Box推广到更一般的形式

举例：

Query Types	Examples
‎单跳查询‎	‎氟维司群引起的不良事件是什么？‎ ‎ （e：氟维司群，（r：原因））‎	[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zbnJtWAo-1663923852351)(D:\python\图机器学习的应用与相关方法读书笔记\method\32.png)]
‎路径查询‎	‎什么蛋白质与氟维司群引起的不良事件有关？ ‎ ‎（e：氟维司群，（r：原因，r：Assoc））‎	[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dPGUTZnp-1663923852352)(D:\python\图机器学习的应用与相关方法读书笔记\method\33.png)]
‎连接查询‎	‎治疗乳腺癌和引起头痛的药物是什么？‎ ‎ （（e：BreastCancer，（r：TreatedBy）），（e：偏头痛，（r：CausedBy））‎	[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VhwPxaYr-1663923852352)(D:\python\图机器学习的应用与相关方法读书笔记\method\34.png)]

2. 从One-hop query到path queries（完整KG）

1.单跳查询

对于单跳查询，可以说非常简单，因为在KG里面已经有( h , r , t ) 的三元组了，这个时候的单跳查询相当于：问题( h , ( r ) )的答案是t吗。

例如：张三的爸爸是谁？

2.路径查询

然后可以把单跳查询扩展到多跳查询，就是加多个关系进行计算，多个关系就会形成路径（path） $q=(v_a(r_1,……,r_n))$ ,其中 $v_a$ 是开始实体，后面那些就是路径。图形化后如下

请添加图片描述

例子：燕小六的七舅姥爷的三外孙女

做这个查询就是要用图的遍历即可，先遍历第一步 $r_1$ :
请添加图片描述

遍历第二步 $r_2$

请添加图片描述

但是实际上没有这么简单，因为KG是不完整的。
例如：如果Fulvestrant和Short of Breath之间少了一个关系，那么会导致最后结果少了一个。

请添加图片描述

3. 为什么不能先做知识补全

根据第九章的知识，我们知道可以做知识图谱补全任务，是不是补全了之后再来做推理就完美了？答案：不是的
因为在知识图谱补全任务中，得到的补全的结果是一个非常稠密的图，补全任务中得到的关系是一个概率，所以大多数节点都会有一定概率出现关系（边）。‎遍历密集 KG 的时间复杂度是指数级的，是路径长度的函数‎𝐿：时间复杂度为 $O(d_{max}^{L})$

请添加图片描述

2. Answering Predictive Queries on Knowledge Graphs（交集）

通过上面的例子我们知道，为了保证查询的准确性，我们最好要将知识图谱进行补全。但是知识图谱补全的时间复杂度太高，所以我们通过其他的办法来解决，在不进行知识补全的情况下依旧能够回答出准确的答案的这个问题

预测查询

要在缺失信息（边）的情况下作出回答，相当于：‎链接‎‎预测任务的泛化‎

核心思路：

根据TransE的socore函数： $f_r(h,t)=-||h+r-t||$

可以把查询的表征理解为：q = h + r ,那么‎预测查询‎的目标就是要使得查询的表征与答案的表征越近越好。 $f_q(t)=-||q-t||$

单跳查询

请添加图片描述

多跳查询

$q=(v_a(r_1,……,r_n))$

请添加图片描述

具体步骤如下

这样做的好处：嵌入过程仅包含向量相加，与KG中总实体数无关，即 $q=v_a+r_1……+r_n$

请添加图片描述

几个KG补全模型中，只有TransE能处理‎组合‎‎关系‎，TransR / DistMult / ComplEx则不行。

3.Query2box: Reasoning over KGs Using Box Embeddings（交集）

连接查询（完全图）

1.问题描述

对于更加复杂的Conjunctive Queries，上面的模型就不好用了，举例：

‎“哪些药物会导致呼吸急促并治疗与蛋白质ESR2相关的疾病？”‎
‎ 查询：（（e：ESR2，（r：Assoc， r：TreatedBy）），（e：呼吸急促，（r：CausedBy））‎

请添加图片描述

按KG traversal（遍历知识图谱）的思路，把这个连接查询分解为两个路径查询，然后求公共区域（不是求交）：

请添加图片描述

这也是在完全图的视角下完成的，如果缺少某个边，那么还是不行：

请添加图片描述

2.解决办法：Box Embedding

再回过头来看这个图，实际上这里面的灰色三个点实际上可能包含多个实体，解决这个表达就要用框。

请添加图片描述

用 hyper-rectangles (boxes) 来建模query：q = ( center(q),offset(q)),就是用一个矩形框来表征几个实体。

请添加图片描述

对于公式中定义的表示：
1.单个实体可以看做offset为0的矩形框，就是一个点。
2.每个关系会产生一个新的矩形框
3.多个矩形框可以做交集操作，得到的仍然是一个框（可以是空）

举例

再次看上面的例子：
“What are drugs that cause Short of Breath and treat diseases associated with protein ESR2?”
查询：((e:ESR2, (r:Assoc, r:TreatedBy)), (e:Short of Breath, (r:CausedBy))
请添加图片描述

请添加图片描述

3. 投影和交互‎

投影操作

P ：Box × Relation → Box

请添加图片描述

相交操作

$j=box\times box\times……box\rightarrow box$

以多个矩形框作为输入，生成相交的框，求相交后的结果小于等于原来Box的面积，相交结果的中心应尽量接近求交的矩形中心。
这个求相交操作也是分别求相交后的结果的面积和中心两个部分。
对于中心：以输入矩形的中心做加权求和后作为新矩形中心。看下图的红色部分。
对于面积：是三个投影相交的公共部分。看下图的阴影部分

请添加图片描述