知识图谱综述(一)
前言
论文《Knowledge Graphs》誉为最全、最好的知识图谱(KG)综述论文。这个系列的博客带你一览该论文的所有内容。
目录和摘要
- 摘要(1):本文介绍工业和学术界的KG场景,这些场景需要利用多元化、动态和大规模的数据。之后,介绍并对比了用于KG的各种基于图数据的模型(用以表示KG)和查询语言。之后,介绍了KG中的模式(方案)、标识和上下文。之后,解释了如何使用演绎和归纳技术来表示知识和提取知识。然后,总结了KG的创建、丰富、质量评估、改进和出版方法。然后,概述了著名的开源KG和企业KG、它们的应用,以及它们如何使用前文介绍的技术。最后高度总结了KG未来的研究方向。
- 关键词:信息系统(基于图的数据库模型)、信息整合、KG
- 引言(1):相关工作、KG的概念、KG的应用、本文使用的例子(智利的旅游业)、KG综述文献对比、本文结构
- 数据图(4)
- 图结构数据模型的介绍:有向边标签图(多关系图)、异构体、属性图、图数据集、其他图数据模型、图存储;
- 查询(语言):图模式、复杂的图模式、导航图模式、其他特性。
- 模式、标识符、上下文(12)
- 模式:语义模式、验证模式、紧急模式(图摘要);
- 标识符:持久标识符、外部标识符链接、数据类型、词汇化、已存在节点;
- 上下文:直接表示、具体化、更高层级的表示、注释、其他上下文框架。
- 知识演绎(23)
- 本体:解释、个体、属性、类别、其它特征;
- 语义和蕴涵:模型论语义、蕴涵、If–then 和 if-and-only-if 的语义区别;
- 推理:规则、描述逻辑。
- 知识归纳(23)
- 图谱分析:技术(中心、社区检测、连通性、节点相似度、寻找路径)、框架、数据图分析、查询的分析、蕴涵分析;
- KG嵌入:转移模型、张量分解模型、语言模型、蕴涵感知模型;
- 图神经网络GNN:递归GNN、卷积GNN;
- 符号学习:规则挖掘、公理挖掘。
- 创造与丰富(50)
- 人类协作;
- 文本数据源:预处理、命名实体识别NER、实体链接、关系抽取、联合任务;
- 标记语言数据源:基于包装器的提取、web表提取、深度网络爬取;
- 结构化数据源:从表映射、从树映射、从其他KG映射;
- 模式/本体创建:本体工程、本体学习。
- 质量评估(58)
- 精确度:句法准确度、语义准确性、同步性(及时性);
- 覆盖范围:完整性、代表性;
- 相关性:一致性、有效性;
- 简明:简洁性、具象简洁、可理解性;
- 其他质量维度。
- 细化(61)
- 补全:一般链接预测、类型链接预测、标识符链接预测;
- 纠正:事实验证、不一致性修复;
- 其他细化的任务。
- 出版(65)
- 最佳实践:FAIR原则(可检索性、易得性、互操作性、可重用性)、关联数据原则;
- 访问协议:dump格式、节点查找、边模式、(复杂的)图模式、其他协议;
- 使用控制:授权、使用规则、加密、匿名化。
- KG的实际应用(73)
- 公开KG:DBpedia、YAGO、Freebase、Wikidata、其他公开的跨领域KG、特定领域的公开KG;
- 企业KG:web检索、贸易、社交网络、金融、其他行业。
- 总结和结论、未来的方向、致谢(77)
- 参考文献(79)
- 附录A:背景(108)
- KG历史背景
- 2012年前的KG
- 2012年后的KG
- 附录B:形式化定义(114)
- 图数据模型:多关系图、异构图、属性图、图数据集;
- 查询:图模式、复杂图模式;
- 模式:语义模式、验证模式、紧急模式;
- 上下文:注释域;
- 知识演绎:图解释、规则、描述逻辑;
- 知识归纳:图并行框架、KG嵌入、GNN、符号学习。