《Knowledge Base Completion By Learning...》阅读笔记

最新推荐文章于 2022-04-08 20:50:47 发布

weixin_33946020

最新推荐文章于 2022-04-08 20:50:47 发布

阅读量338

点赞数

文章标签：数据结构与算法 python 人工智能

原文链接：https://my.oschina.net/u/3877634/blog/1839655

版权

2019独角兽企业重金招聘Python工程师标准>>>

Knowledge Base Completion by Learning to Rank Model

基于模型排序学习的知识库推理

摘要

1. 知识库推理（Knowledge Base Completion）就是从KB中已有的事实预测新的事实；

2. 目前的方法是PRA（Path Ranking Algorithm），基于连接实体的路径类型预测事实，并将预测当做分类问题（使用逻辑回归）；

3. 本文的方法是将关系预测视作一个排序问题，并基于YAGO进行试验，最终成绩优于各种分类模型。

介绍

尽管知识库在不断壮大，但是知识库仍然不完整，缺失大量的事实，知识库推理就是通过已有事实来预测未知的事实从而来填补缺失的事实。

符号方法使用规则或者关系路径来推理新的知识，比如PRA算法；嵌入方法将推理问题看做一个矩阵完备（matrix completion）问题，学习KB中的实体和关系在低维空间的表示形式；当然也有人试着将两个方法结合在一起，比如基于路径的TransE（Modeling relation paths for representation learning of knowledge bases, Lin, EMNLP2015）。

本文主要研究PRA算法和它的扩展。

PRA算法

PRA使用随机行走（random walk）来遍历有限长度的连接着实体对的路径，实体对之间包含多关系实例。根据给定关系预测新关系实例的分类器将使用这些路径作为特征。在PRA中，每个关系路径都可被看做一个逻辑规则，因为PRA实际上是一种有区别性训练的逻辑推理。

PRA抽取关系路径来建立LR（Logistic Regression）分类模型，它基于LCWA（local close world assumption）来生成负实体对。然而，真实的KB中有太多的负实体对，以致于正负实体对非常不均衡。另外，知识库推理使用候选实体对来填充缺失的事实，对这些候选进行排序比给他们分类或者评分要更合理。