摘要
开放知识图谱(KG)完成的任务是从已知的事实中得出新的发现。增加KG完成度的现有工作需要(1)事实三元组来扩大图推理空间,或(2)手动设计提示从预训练的语言模型(PLM)中提取知识,表现出有限的性能,需要专家付出昂贵的努力。为此,我们提出了TAGREAL,它自动生成高质量的查询提示,并从大型文本语料库中检索支持信息,从PLM中探测知识以补全KG。结果表明,TAGREAL在两个基准数据集上达到了最先进的性能。我们发现TAGREAL即使在有限的训练数据下也具有出色的性能,优于现有的基于嵌入、基于图和基于plm的方法。
1.介绍
知识图(KG)是一种异构图,它以实体-关系-实体三元组的形式编码事实信息,其中关系连接头部实体和尾部实体(例如,“Miamilocated_in-USA”)(Wang等人,2017;Hogan et al, 2021)。KG (Dai等人,2020)在许多NLP应用中起着核心作用,包括问答(Hao等人,2017;Yasunaga等人,2021)、推荐系统(Zhou等人,2020)和药物发现(