YAGO是一个基于链接数据库的开放语义知识库,由德国马普研究所与巴黎电讯科技大学于2007年联合开发,基于Creative Commons Attribution协议。其主要特点是从Wikipedia、WordNet和GeoNames等来源提取事实,形成了一个包含丰富语义信息的知识库。
YAGO的数据规模庞大,包含约5亿个实体和20亿条事实,这些事实可以在时间和空间上进行锚定。此外,YAGO还具有预定义的模式、关系和逻辑约束,使其成为一个结构化且“合理”的知识库。与DBpedia相比,YAGO不仅包含更多的实例(5亿个),还通过自动生成的方式补充了DBpedia中缺失的部分。
YAGO的知识库支持多种输出格式,包括TSV和RDF/Turtle,并且可以通过简单的文本文件存储内部数据。它还可以直接连接到DBpedia云知识库,并在多个项目中提供支持,例如SUMO Ontology、DBpedia计划和Freebase等。
YAGO是一个广泛使用的本体,其数据量大、事实信息丰富,对知识图谱的构建和分析具有重要价值。
YAGO是一个由德国马普学会(Max Planck Institute)开发的大型语义知识库,其构建过程涉及从多个来源提取事实,并通过一系列规则和算法进行整合和优化。以下是YAGO从Wikipedia、WordNet和GeoNames等来源提取事实的详细过程:
-
从Wikipedia提取事实:
- YAGO首先从维基百科的Infobox和类别系统中提