前言:对于用户输入的一组实体,已经有一些算法可以从知识图谱中高效搜索能够连接这组实体的一些关联子图,但这样的子图可能不存在,或者规模太大而实际意义不大。为此,在这篇被Journal of Web Semantics录用的论文中,我们研究了知识图谱关联搜索中的查询松弛问题。
论文下载地址:https://doi.org/10.1016/j.websem.2020.100557
以下,由论文第一作者硕士生李舒馨介绍这篇论文的主要内容。
==========
在很多领域我们都需要在大的实体关系图上搜索查询实体间的直接或间接关系。搜索的结果称为语义关联,通常是包含所有查询实体的紧凑(例如,直径有上界)的连通子图。关联搜索问题虽然存在有效的算法,但如果某些查询实体在图上距离较远,则可能返回空结果。为了减少这种情况的出现并提供替代的结果,我们研究了关联搜索上的查询松弛问题。如果简单地放松紧凑性约束(增大直径),这不仅破坏了语义关联的紧凑性,更可能导致性能问题。因此,我们考虑另一种解决方案,从原始的失败查询中移除最小数量的实体,得到最大成功子查询,最小化松弛导致的结果质量损失。我们证明,验证子查询的成功可以转变为以下问题:找到一个实体(称为certificate),该实体与查询实体间满足基于距离的条件。为了找到验证最大子查询成功的 certificate,我们提出了一种 best-first 搜索算法,利用基于距离的估计有效地减少搜索空间。并且,我们提出了两种新的