知识图谱产品主要包括数据接入、信息提取、知识融合、知识加工、图谱应用等环节,历经数据➡信息➡知识➡应用等流程,形成了闭环的图谱应用展示。
数据接入层面指的是全量数据,在互联网大数据背景下要集成全网、全领域的数据信息,实现数据融合应用。
信息提取,是从各种类型的数据源中提取出实体、属性以及实体间的相互关系,在此基础上形成本体化的知识表达;
知识融合,是在获得新知识之后,需要对其进行整合,以消除矛盾和歧义,比如某些实体可能有多种表达,某个特定称谓也许对应于多个不同的实体等,在这个过程中,要通过实体链接形成点、边、权的组合,构建零散的图;
知识加工,实现图形的整合、梳理,生成关系型数据库;通过知识合并讲关系型数据库与外部知识库进行融合、汇总;经过融合的知识,要经过知识推理完成知识的验证、筛检工作,并通过进一步的质量评估,分离合格的知识加入知识库,应用于图谱展示。如果在展示过程中发现错误,通过知识更新环节迭代知识库,重回知识推理、质量评估,再次进行应用发布。
图谱应用是产品应用的核心,其本身是一个具有属性的实体通过关系链接而成的网状知识库,从图的角度展示成概念网络,其中的节点表示物理世界中的实体(或概念),而实体之间的各种语义关系则构成网络中的边。