论文笔记整理:叶群,浙江大学计算机学院,知识图谱、NLP方向。
会议:ESWC 2020
链接:https://suchanek.name/work/publications/eswc-2020-yago.pdf
Introduction
YAGO是世界上最大的链接数据库之一,由德国马普研究所发布。在本篇论文中,作者发布了最新版本的YAGO 4,包含约20亿三元组和6400万实体,融合了schema.org规范的分类体系和Wikidata丰富的实例数据。
Wikidata被认为是世界上最大的知识库之一,包括了超过7000万实体。与此同时,Wikidata社区对自己的定位是信息的集合,而不是我们传统意义上的“知识”。Wikidata没有严格的语义约束,且存在一些不同来源的自相矛盾的描述。对于下游应用来说,Wikidata的分类体系过于复杂和令人费解;经典的推理机无法在Wikidata知识库上进行推理,因为其本身存在很多不一致性。
举个例子阐述Wikidata的分类体系存在的问题,实体“布达拉宫”是“touristattraction”的一个实例,而“to