1、本体在计算机领域中常用于描述语义知识,可作为某一专业领域知识的泛用概念模型,该模型包含概念与概念之间的关系以及描述它们的属性,不包含相关领域中具体个体的信息。
2、知识图谱模式层中的节点用于表示本体概念,边表示本体中概念间存在的联系。知识图谱的概念模型可通过模式层来表示,通过定义一系列的规范来对知识图谱数据层进行约束。可使用构建完成的本体作为知识图谱模式层,参考本体中定义的约束与限定条 件来对数据层进行约束,提高知识图谱的质量,知识图谱构建过程可看作本体的实例化数据填充过程,其中数据层能看成本体中概念的实例。在不需要进行知识推理的情况下知识图谱不需要构建模式层。
3、自顶向下方式通常先定义知识图谱的本体,从顶层出发逐步细化模式层的层次,我们可通过本体编辑器或手工构建方法来构建知识图谱模式层,然后将数据添加到概念中。 该方法可确保知识图谱构建过程中领域知识概念和类别层次是正确的,但是人工依赖性较强,对于小规模的领域知识图谱构建较为合适。
4、领域知识图谱构建流程:采用自顶向下的方法:参考研究领域相关论文与研究,确定领域本体范围,定义类的关系和属性完成本体构建;接着利用不同的知识抽取技术从文本中抽取所需知识来扩充知识图谱的规模;最后利用Neo4j 图数据库来实现知识图谱数据的存储。
5、本体与知识图谱相同之处在于:它们都用于表示某一领域中的知识,对某一领域中的知识进行形式化表达。 不同之处在于:本体侧重于描述领域知识中概念与概念之间存在的关系,它是一种 概念模型,能较好的对领域知识进行层次性、抽象性描述,但是不涉及到具体知识。大多数领域本体中都没有过多的实例数据,后续可根据本体的约束条件在本体基础上进行实例数据的填充。
6、RDF使用类与属性来定义实体间存在的三元组关系,其中包含的类和属性可通过模式(schema)来表示。RDF Schema(RDF模式)提供对类与属性的基本描述,RDFS 是对 RDF 的改进,提升原有的 RDF 对资源的描述能力,部分基本描述元语如下:
- rdf:Property : 用于表示资源属性;
- rdf:type : 用于表明该资源属于某一类型;
- rdfs:subClassOf : 常用于定义或描述某一实体类的父类成员;
- rdfs:domain : 资源属性描述元语的实例,用于指定该类所具有属性的限制范围;
- rdfs:range: 用于指定本体中概念属性的值域。
7、OWL 本体描述语言是 W3C 组织颁布的最新标准,它在 RDFS 语言的基础上进一步扩展以获取更强的领域知识表达能力,具有知识推理能力。
8、本体构建有多种方法,其中比较著名的有骨架法、IDEF5 法和七步法等。
- 骨架法:描述本体开发基本流程和指导,具体内容包含 4 个方面:①确定本体的应用场景和领域范围;②构建相对应的领域本体;③按照要求对本体进行评价;④用本体语言来描述本体。
- IDEF5 法:主要构建流程为:①定义课题并组织课题组人员;②采集对应数据; ③对数据进行分析;④初步构建本体;⑤对本体进行完善并验证。
- 七步法:由七个步骤组成:①确定本体范围;②重复使用现有的本体;③列出领域核心概念;④定义领域概念间的上下级结构;⑤定义概念具有的属性;⑥定义概念属性的取值范围;⑦添加实例数据。
9、自动化本体构建过程包含三个阶段,参考:知识图谱开发笔记_rdf文件格式_马良神笔的博客-CSDN博客
实体并列关系相似度计算
用于考察任意给定的2个实体在多大程度上属于同一概念分类的指标测度,相似度越高,表明这2个实体越有可能属于同一语义类别。
如“中国”和“美国”作为国家名称的实体,具有较高的并列关系相似度;而“美国”和“手机”这两个实体,属于同一语义类别的可能性较低,因此具有较低的并列关系相似度
主流计算方法:模式匹配法和分布相似度。
实体上下位关系抽取
用于确定概念之间的隶属(IsA)关系,这种关系也称为上下位关系。
如词组(导弹,武器)构成上下位关系,其中的“导弹”为下位词,“武器”为上位词。
主要研究方法:①基于语法模式(如Hearst模式)抽取IsA实体对;②利用概率模型判定IsA关系和区分上下位词,通常会借助百科类网站提供的概念分类知识来帮助训练模型,以提高算法精度;③用跨语言知识链接的方法来构建本体库;
本体的生成
本体生成主要是对各层次得到的概念进行聚类,并对其进行语义类的标定,即为该类中的实体指定1个或多个公共上位词。
主要研究方法:实体聚类方法
10、类的属性主要分为两种,即对象属性、数据属性。
11、
12、
13、
14、本体库对公理、规则和约束条件的支持能力可以用来规范其实体、属性和实体之间的密切联系。
参考博客:Protégé基本教程【Protégé5.5.0版本】_protege_喵木木的博客-CSDN博客
15、对象属性特性的定义
Funcitinal
在这里,Functional可以认为是函数中的“单映射”关系。如果一个对象属性的特性是Functional(单值的),那么对于某个实例来说,通过这个对象属性进行关联的实例有且仅有一个。
Transitive
Transitive定义了对象属性的传递性。下图是《手册》中的一个例子,假设对象属性“hasAncestor”具有“Transitive”的特性,如果已知“Matthew hasAncestor Peter”和“Peter hasAncestor William”,那么可以由“hasAncestor”的传递性推理得到“Matthew hasAncestor William”这一事实。
Symmetric
Symmetric定义了对象属性的对称性。在家庭成员中,如果Matthew有一个兄弟姊妹(hasSibling)叫Gemma,自然Gemma也有一个兄弟姐妹(hasSibling)叫Matthew。我们可以定义对象属性“hasSibling”是对称的,那么我们只需声明一条事实,另一条事实因为对象属性的“对称性”而自然产生。
Asymmetric
非对称性也比较好理解,比如hasChild这个属性就不能定义为对称的。
Reflexive
Reflexive定义的是对象属性的自反性,也就是自己和自己的关系。比如“know”(认识)这一对象属性,对于每个人来说,自己肯定是认识自己的。
Irreflexive
Irreflexive定义的是对象属性的非自反性,也就是说这个对象属性不能描述实例自身到自身的关系。例如isMotherOf。
16、本体知识库导入neo4j