1.知识图谱表示方法
两大派系: 基于离散符号的知识表示
基于连续向量的知识表示
由于知识图谱是很多搜索、问答以及大数据分析系统的数据基础,基于向量的表示更易于和深度学习模型集成,基于向量的知识图谱越来越重视。
2.知识表示方法(人工智能,知识是智能的基础,让计算机更容易理解)
a. 一阶谓词逻辑表示法
优点:结构性、严密性、可实现性。
缺点:有限的可用性、不能表示不确定性的知识。
b.霍恩子句与霍恩逻辑(类似于一阶谓词法)
c.语义网络表示法(一个带有标识的有向图)
优点:联想性、易用性、结构性
缺点:无形式化(语义网络表示知识手段多种多样)
d.框架表示法
优点:结构性、描述全面并支持默认值与触发器
缺点:构建成本高、默认值增加推理复杂度、无法表示不确定性的知识
e.描述逻辑表示法
优点:结构性、严密性、多样性、易实现性
缺点:表达能力有限、无法表示不确定性的知识。
3.互联网时代的语义网知识表示框架
早期web标准语言:HTML/XML,无法满足语义网的要求。
新的标准语言:RDF/RDFS/OWL (语法与XML兼容)。
查询RDF的语言:SPARQL
网页嵌入:Markup(JSON-LD/RDFa/HTML5 MicroData)
4.常见的开放域知识图谱表示方法
Freebase、Wikidata、ConceptNet (基于离散符号的表达方式)
5.知识图谱的向量表示方法
基于离散符号的表示方法,由于符号不能表达相应语义层面的信息,不能进行语义计算,对下游应用不友好。
将词映射到向量空间,有利于相应的计算。
词的向量表示方法:独热编码、词袋模型、词向量
6.知识图谱嵌入
将知识图谱中的实体和关系映射到连续的向量空间,并包含一些语义层面的信息,可以使得在下游任务中更加方便地操作知识图谱。
知识图谱嵌入的方法: 转移距离模型、语义匹配模型、考虑附加信息的模型
知识图谱嵌入的应用:链接预测(补全)、三元组分类、实体对齐、问答系统、推荐系统
7.建模工具
Protégé工具。