文章目录
知识图谱推理方法
分类
静态知识图谱推理方法
单跳推理方法
翻译距离方法
- 将实体、关系映射到低维向量空间当中,并利用空间向量变化表示实体链接过程
- 优:可解释性强、学习成本低、语义表达能力强
- 基于知识图谱,能够处理语义关系,具有较好的语义表示能力。
- 缺:数据要求高、需要大量的计算资源
- 需要构建完整的知识图谱,对数据要求较高,构建成本较大。是因为翻译距离方法对于未出现在知识图谱中的实体或关系,无法进行推理,存在一定的局限性。
- 对于复杂的语义关系推理,可能需要大量的计算资源,推理效率不高。
- 这也就是为什么翻译距离方法解决的多是单跳任务,因为任务难度较低,不涉及到不可见的实体或关系
神经网络方法
- 利用神经网络学习实体、关系的特征
- 优:语义表达能力强、能够处理大规模知识图谱、泛化能力强
- 基于神经网络,能够自动提取语义特征,具有较强的语义表示能力。在推理过程中能够自动发现实体之间的关系,提高了推理的准确性。
- 能够处理大规模的知识图谱,适用于处理实体关系较为复杂的场景。
- 能够处理未出现在知识图谱中的实体或关系,具有较好的推理泛化能力。
- 缺:可解释性较低、学习成本较高
- 可解释性较低,同时需要大量的计算资源因此学习成本较高
多跳推理方法
路径推理方法
- 将知识图谱视为一个有向图,并利用强化学习的方法在知识图谱上随机游走,并通过推理得出两个实体之间的路径
- 优:泛化能力强、表达能力强
- 对于一些复杂的语义关系,能够比较好地进行处理,具有较好的表达能力。
- 能够处理未出现在知识图谱中的实体或关系,具有较好的推理泛化能力。
- 缺:长路径推理性能下降、路径可解释性低
- 知识图谱查询嵌入推理方法需要大量的训练数据和计算资源来学习实体之间的嵌入向量,会增加推理的成本和复杂度。
查询嵌入方法
- 查询嵌入的方法将知识图谱嵌入几何空间,并将逻辑运算符表示为空间几何变化。
- 优:高效性、可解释性强
- 知识图谱查询嵌入推理方法可以将推理过程转化为向量运算,大大提高了推理效率。
- 知识图谱查询嵌入推理方法可以通过可视化方式展示实体之间的嵌入向量,方便用户理解和解释推理结果的含义。
- 缺:需要大量的训练数据和计算资源
- 知识图谱查询嵌入推理方法需要大量的训练数据和计算资源来学习实体之间的嵌入向量,会增加推理的成本和复杂度。
神经规则方法
- 将规则视为多分类问题,并用神经网络学习规则特征
- 优:灵活性强、可解释性强
- 知识图谱神经规则推理方法可以使用不同类型的规则进行推理,从而具有更大的灵活性和适应性。
- 知识图谱神经规则推理方法能够通过规则来解释推理结果的含义,方便用户理解和解释推理结果。
- 缺:推理的精度过度依赖于规则的可靠性
- 规则的制定和应用可能存在误差和不确定性,这可能会影响推理的准确性和可靠性。
- 知识图谱神经规则推理方法需要大量的训练数据来训练神经网络,
时态知识图谱推理方法
插值推理方法
等价于单跳。可以直接在知识图谱中找到对应的答案,并且可以直接连接
时间编码方法
通过扩展静态知识图谱推理方法,将时间以特殊形式编码融合进原有算法当中,这类方法呢具有效率高、学习成本低的有点,但是同时,毕竟是扩展静态知识图谱方法,有些静态方法是针对某些问题而定向优化得来的,所以,扩展这类方法到时态知识图谱中,会出现不适用的表现,因此会产生变现两级分化的状态
- 扩展原有静态知识图谱单跳推理方法,将时间戳以特定方式编码,并融合在原有模型当中
- 优:效率高、学习成本低
- 缺:表现两级分化
外推理方法
等价于多跳。假设不完整的知识图谱上没有直接到达的方案,需要通过中间节点或者隐藏节点中转才能到达
进化网络方法
- 将时态知识图谱视为众多的时间子图,并通过动态图神经网络学习各个子图的结构和进化历史
- 优:能够实现动态推理
- 缺:数据量增加、无效信息过多、可解释性差
路径推理方法
- 将时态知识图谱视为一个有向图,并利用强化学习的方法在时态知识图谱上随机行走
- 优:能够得出有效路径
- 缺:需要数据预处理、路径时间误差较大
时态知识图谱推理在问答系统中的应用
- 时间约束分解
- 将原始问题分解为非时间问题和时间约束问题。然后使用传统的知识图谱问答方法寻找子问题的候选答案。
- 优:速度快、学习成本低
- 缺:预先指定的模板进行分解、泛化能力有限
- 时间图表示法
- 利用时态知识图谱推理方法学习实体嵌入、关系嵌入和时间戳嵌入,然后使用时态知识图谱嵌入到问题嵌入的距离来对答案进行评分。
- 优:不依赖于制定的规则、提供可学习的推理过程
- 缺:时间约束力较低、无法处理带有时间感知的词汇(e.g. 之前/之后,首先/最后 等)
当前问题和最新进展
时态知识图谱单跳推理
-
挑战
-
时间表示局限性的问题
-
时间间隔数据与单时间戳事实无法统一嵌入
-
时间间隔表示方法缺失
-
-
单跳推理模式下,相似性嵌入问题
- 实体、时间、关系同一平面嵌入
- 嵌入时间后,无法区分语义层级
-
-
新进展:针对时间表示局限性与相似性嵌入问题,提出了基于极坐标系的时态知识图谱单跳推理模型
-
基于极坐标系的时态知识图谱单跳推理模型
- 时间嵌入实体模块:
- 实体通过模向量部分和角向量部分的放缩和旋转形成时间感知实体嵌入
- 关系嵌入模块:
- 将时间感知头实体根据关系旋转放缩到新的位置
- 分别评价转换后的头实体与尾实体的模和角
- 时间嵌入实体模块:
静态知识图谱多跳推理
-
挑战
- 路径推理路径可信度问题
- 推理路径无法自动验证可靠性
- 二进制奖励造成奖励反馈稀疏
- 查询嵌入推理固化问题
- 过度依赖于固定逻辑结构
- 无法实现复杂逻辑结构推理
- 需要大量的数据支持
- 路径推理路径可信度问题
-
新进展:针对路径推理可信度与查询嵌入固化问题,提出了一种基于强化学习的可信性知识图谱多跳推理模型
-
基于强化学习的可信性知识图谱多跳推理模型
将随机游走的过程视为一个马尔科夫决策过程,以查询实体为起始状态开始行走,并通过策略网络在行动空间中选取概率最高的行动作为下一步状态,在到达最终位置时候,通过奖励函数,将奖励反馈给代理。
其中,为了提升路径可靠性,模型在行动空间中添加逻辑规则,并通过逻辑结构选取额外的节点作为推理的过程,从而实现复杂逻辑结构的拼接,突破查询嵌入的固有长度,其次,在奖励函数中添加逻辑结构得分,从而摆脱二进制奖励的稀疏特性,并给予路径可靠性的奖励。
时态知识图谱多跳推理
-
挑战
-
时间间隔无法处理的问题
- 离散时间感知事实,增加数据量
- 时间间隔事实需预处理
-
基于时间快照推理方法问题
- 按照时间序列推理,需设定时间限制
- 无法处理复杂时间间隔路径
-
-
新进展:针对时间快照特性以及时间间隔事实无法推理的问题,提出了一种基于强化学习的可信性知识图谱多跳推理模型
-
基于强化学习的时间间隔知识图谱多跳推理模型
- 时间表示模块:
- 时间表示模块利用起始时间与终止时间的中位数以及变化量拼接来表示时间间隔
- 时间逻辑特征学习模块:
- 利用历史关系模拟两个事件的时间逻辑关系
- 时间表示模块:
时态多跳推理模型在问答系统中应用
-
挑战
- 时间约束力问题
- 时间约束力差,问答答案可信度较低
- 对时间感知词汇不敏感
- 复杂大规模场景下推理模式问题
- 子图中无效信息过多
- 基于时间子图的推理方式导致实体过度调用的
- 时间约束力问题
-
新进展:基于复杂场景推理问题,提出了一种基于时间加权的时态知识图谱多跳问答推理模型
-
基于时间加权的时态知识图谱多跳问答推理模型
时间加权子图
- 将时间子图转化为以实体为中心的静态子图
- 通过时间加权的方法限制无关关系表达能力