知识图谱
-
概念
知识图谱是一系列可以用来展示知识的发展和结构关系的图形,它充分采用可视化技术,不仅能够对知识资源和载体进行描述,同时还可以对知识以及知识之间的练习进行分析和描述。 -
构建流程
三个部分:知识单元的构建,知识单元间关系的构建和知识的可视化三个部分。其中前两个部分是构建知识图谱的最基本任务。 -
图谱类型
领域无关知识图谱:这类知识图谱通常不限定于特点的领域,包含的内容较广泛。
特定领域知识图谱:这类知识图谱一般针对特定领域,虽然内容不如无关知识图谱那样广泛,但是能够囊括特定领域中的知识内容,更具有针对性。
跨语言知识图谱:这类知识图谱包含知识的多种语言描述。 -
构建方法
1.基于网络百科资源的构建方法:这一类方法通常会从维基百科,百度百科等资源中提取所需内容。AVP知识抽取是一种知识图谱信息提取的重要方法。
2.基于结构化数据的知识图谱构建方法
结构化数据是知识图谱的一个重要数据来源,这些数据一般存于关系型数据库。RDF是一种资源描述框架,可以形式化地表示结构信息,它一般用来描述网络资源。
3 .基于半结构化数据的知识图谱的构建方法: 许多属性隐藏在一些表格或列表中 ,此时需要对这些半结构化的数据进行抽取 。
4 .基于非结构化的数据的知识图谱构建方法:
非结构化数据的知识抽取要比结构化数据,半结构化数据复杂得多 ,目前在知识图谱构建中应用并不广泛。 但是许多领域缺乏结构化和半结构化的知识来源,此时非结构化数据是主要的知识来源。 -
知识单元构建
当前釆用较多的技术主要是利用文本挖掘对知识单元进行抽取,此外 ,元数据 、自动标引技术也是 知识单元抽取的重要方法 。釆用 文本挖掘等方法进行自动挖掘 ,采用的也多是词频统计 、TF/IDF 等简单的挖掘手法, 准确率有待提升 . -
知识单元关系的构建
为发现知识间的关系,更好地展示各单元,需要样本数据的进一步处理。当前采用 较 多 的方式有关联分析 、 因子分析、 多维尺度分析、 自 组织 映射 图 ( S OM) 、 寻 址 网络 图谱 ( PTNET ) 、 聚类分析 、 潜在语义分析、 最小生成树法等 。
构建单元关 系 的方法主要有 XTM 技术、 本体技术 ,数据挖掘方法等。 -
知识图谱的可视化展示
知识单元及其关系可以通过不同图形来可视化展示 , 例 如几何图 、 战略图 、冲积图 、 主题河图 、 地形图 、星团图等。
参考文献: 基于深度学习的商业领域知识图谱构建