论文动机
传统的规则挖掘算法因计算量过大等原因无法应用在大规模 KG 上。为了解决这个问题,本文提出了一种新的规则挖掘模型 RLvLR (Rule Learning via Learning Representation),通过利用表示学习的 embedding 和一种新的子图采样方法来解决之前工作不能在大规模 KG 上 scalable 的问题。
论文亮点
本文亮点主要包括:
1. 采样只与对应规则相关的子图,在保存了必要信息的前提下极大减少了算法的搜索空间和计算量;
2. 提出了 argument embedding,将规则表示为 predicate sequence。
概念
1. closed-pathrule,LHS 记为 body(r),RHS 记为 head(r);
2. support degree of r,满足 r 的实体对个数;
3. standard confidence 和 head coverage。