知识图谱技术要素:
表示、存储、抽取、融合、推理、问答、分析、其他
表示:属性图表示(property Graph)-RDF图模型-OWL本体建模-规则表示
存储:关系图存储-原生图存储-图查询语言
抽取:概念抽取-实体识别-关系抽取-事件抽取
融合:实体对齐-本体映射-概念匹配
推理:符号推理-规则推理-图推理-神经网络推理
问答:问句理解-语义解析-答案生成
分析:图算法-图嵌入-图神经网络-图可视化
其他:众包-Scene Graph@CV-SemanticIOT
基于图的知识表示:
有向标记图:最简单、最接近自然语言和人脑认知的数据模型。
知识图谱最基本的组成单元是三元组:subject、predicate、object(主、谓、宾)
图数据存储与查询:
图数据库充分利用图的结构建立微索引,其查询复杂度与数据集整体大小无关,仅正比与相邻子图的大小。
知识抽取:
从不同来源、不同结构的数据中进行知识抽取,形成只是存入到知识图谱。
文本一般不作为知识图谱构建的初始来源,多用来做知识图谱补全。
知识图谱抽取:概念(Concept)、实体(Entities)、关系(Relation)、事实(Facts)、事件(Events)、规则(Rules)
知识图谱融合:
融合层面:本体层面的融合、实体层面的融合。
知识图谱推理:
属性补全、关系预测、错误检测、问句扩展、语义理解。
推理的方法主要分为两类:
基于符号逻辑的推理方法:OWL Reasoners、Datalog、Rete等。(优点:具有可解释性;缺点:无法处理隐含或不确定信息)
基于图结构或表示学习的方法:PRA、AMIE、TransE、Analogy、
Deeppath、NeuralLP等。(优点:推理效率高,能表征隐含知识;缺失:丢失了可解释性)
KBQA(知识问答):
问句->语义解析->语义表示(基于符号的表示方法or基于分布式的表示方法)->语义匹配、查询、推理->知识图谱
图算法与图神经网络:
图基础算法、图Embedding、图神经网络