一、知识图谱的基本概念
知识图谱其实就是一个庞大的知识库,以前的搜索引擎是根据关键字进行的搜索,搜索出的内容是有关键字的网页就会被搜索出来,运用了知识图谱后根据搜索的内容就会将与关键字相关的内容进行展示。例如:百度搜索马云,就会展示出与马云相关的内容,包括事迹以及与马云相关的经济方面的人物信息,更容易让用户能够抓住自己感兴趣的内容。
知识图谱通过对错综复杂的文档的数据进行有效的加工、处理、整合,转化为简单、清晰的“实体,关系,实体”的三元组,最后聚合大量知识,从而实现知识的快速响应和推理。
知识图谱其实就是由节点和边组成,节点就是每一个实体,例如:一个人,边就是描述实体与实体之间的关系,例如:这个人与其他人的关系。即三元组的形式:实体--边---实体
知识图谱的数据构成:数据模型和具体数据,其中数据模型就相当于一个大体的框架,具体数据就是填充到框架中的数据。例如: 数据模型是三国时期的历史人物,那么具体数据就是该人物的生平、主公、兄弟、家人、以及所参与的战役。
二、知识图谱的构建
知识图谱有自顶向下和自底向上两种构建方式。
1.所谓自顶向下构建是借助百科类网站等结构化数据源,从高质量数据中提取本体和模式信息,加入到知识库中;
2.所谓自底向上构建,则是借助一定的技术手段,从公开采集的数据中提取出资源模式,选择其中置信度较高的新模式,经人工审核之后,加入到知识库中。
如下图: