本文旨在讲解知识图谱的构建、理解以及应用,笔者也将会根据自身的学习情况持续更新。
与其他面向知识的信息系统相比,知识图谱有其独特的知识表示结构,信息管理流程以及搜索算法。知识图谱的概念来自于2012年谷歌开始将知识图谱应用于他的搜索引擎,使得用户能够搜索人、地点、以及文档,而不仅仅是序列匹配。由于谷歌的成功,知识图谱也渐渐在世界的公司取得了较好的发展势头。
知识图谱最基本表示单元是一个实体,每一个实体都会有各种各样的属性,不同实体之间会有关系相连接,关系亦能够将两个不同领域的知识图谱连接起来。每个实体需要有独特的identification来标识,每一个实体的id必须独一无二,实体与关系的类型由OWL(类似schema)定义。知识图谱是需要保持一致性以及具有良好的正确性、兼容性、容错性、可扩展性等。
1.1知识图谱的历史简要
语义网:
语义网就是将对象、概念和状态用点,关系用弧表示出来,但由于语义网没有标准的句法和语义表示,使用者则可以做出不同的解释,并且语义网不允许使用者自己定义节点和弧线的含义。
Linked Data:
基于RDF和OWL 的Linked Data能在不同的领域发布和共享数据,其中RDF用来描述对象,而OWL提供一种标准的模式来解释数据,由此RDF可以通过图像的方式联系到一起,包括schema层级的mapping和对象层级的绘图。
Introducing the Knowledge Graph: things, not strings:
知识图谱可以理解真实世界实体和实体之间的关联,实体而不是字符串,例如你查找[taj mahal]这个que