好记星不如烂笔头,而且最近由于项目的需要,看了一些知识图谱的资料,突发奇想在这里记录下自己的学习过程,刚开始写会有很多的缺陷,还请读者给出宝贵的建议;下面就言归正传,开始写笔记了。
在我们在百度里面搜索知识图谱,都会从Google在2012年发布的一篇博客的开始说起的,然后开始讲解未来搜索引擎的发展等等之类的东西。通过最近看的资料,我发现其实知识图谱起源并不是从Google那篇的博客,我目前看到的资料在2008年国内就有相关资料《科学知识图谱的发展历程》(目前我看到最早的)。所以这里关于Google提出知识图谱之后的发展,我在这里不做讲解可以参考其他网站。 我这里先从知识库和知识图谱的区别开始。
知识图谱和知识库的概念:
知识图谱本质上是一种语义网络。其结点代表实体(entity)或者概念(concept),边代表实体/概念之间的各种语义关系。知识图谱(或者知识库)可以看做是服从于本体(Ontology ) 控制的知识单元的载体,即本体(Ontology )是蛋糕的模具,Knowledge Base 是蛋糕。知识图谱是基于图的数据结构,它的存储方式主要有两种形式:RDF存储格式和图数据库(Graph Database)。
知识库是知识工程中重中之重结构化,易操作,易利用,全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合。这些知识片包括与领域相关的理论知识、事实数据,由专家经验得到的启发式知识,如某领域内有关的定义、定理和运算法则以及常识性知识等。
知识库就是一个关于相关领域的数据库。知识图谱是一个用图的形式表示和存储的数据库。我在这里理解为知识图谱是知识库的升级版。这样理解的原因如下:
1、知识库通常使用是关系型数据库,但是不代表知识库不能将知识用图的形式展现出来。记得我们在建立关系型数据库之前都要画E—R图。
下班了,先写到这里!