知识表示

最新推荐文章于 2022-11-30 15:19:40 发布

Sarah ฅʕ•̫͡•ʔฅ

最新推荐文章于 2022-11-30 15:19:40 发布

阅读量2k

点赞数 1

分类专栏：知识图谱

本文链接：https://blog.csdn.net/u014765410/article/details/113818101

版权

知识图谱专栏收录该内容

5 篇文章 0 订阅

订阅专栏

知识应用的难点在于知识推理，知识推理的难点在于知识表示，因此，知识表示是基于知识的人工智能应用中的核心部分。

知识表示大致经历了3个阶段的发展：
1，逻辑表示；
2，图谱表示；
3，数值表示；

每一种知识表示方法，都对应了与其相配的知识推理策略，结合我自己所读内容，做一个总结：

一，逻辑表示
逻辑根据其复杂程度，可以分为：命题逻辑，一阶谓词逻辑，高阶逻辑；
命题逻辑：是最简单的逻辑，是对真值的判断，计算结果为 True or False。相当于一道判断题；
命题逻辑仅能用于表达一个简单的事实，且其计算本身是一种二分法，非此即彼，不存在松弛（概率），缺乏灵活性；
此外，每一个命题逻辑都只能表达一个原子信息（无其他需要细化的信息），这意味中，对于现实世界中的每一类型事先，都需要一一列举，而无法泛化。
一阶谓词逻辑：又称一阶逻辑，直白的说，就相当于一个一元函数 f(x)，其中 f 即为 “谓词”，x 即为谓词的操作对象（求解对象），举例说明：假设：兄弟()为一个谓词（函数），其表达式为兄弟（张三，x)，x即为表达式的求解对象（操作对象）。
对于一阶逻辑，f(constant, x)，根据其自定域range，可以将f()称为：谓词 or 函词。
一阶谓词，其自定域可以为一系列值，如：兄弟(张三,x)，x的取值可以是一个集合。
一阶函词，其自定域只能为一个值，如：国籍(汤姆科鲁兹，x)，x 有且仅有一个解。
二阶谓词逻辑：又称二阶逻辑，可以理解为一个二元函数 f(x，y)，此时的 f，可以是对关系的申明，也可以是对属性的申明。
如：兄弟（张三，李四），此时，兄弟()为对关系的申明，而 “张三 and 李四" 都是求解对象；
国籍（汤姆科鲁兹，美国），此时，国籍()为对属性的定义，而 ”汤姆科鲁兹 and 美国“ 都是input；

在逻辑表示中，结合数学符号来表示知识，它让知识表示和知识推理分离，使得推理方法可以完全不依赖于具体领域。运用逻辑表示，即推理，能够得到精确的推断结果，但是不具备容错性，且不能表示不确定性知识（概率），此外，随着知识图谱的扩张，知识逐渐膨胀，在利用数学逻辑推理符号进行推理时，会由于符号的爆炸性增长，而使得计算复杂性呈指数级增长。
除此以外，逻辑推理中，还涉及操作符（数学符号）的优先级问题，处理起来也非常麻烦，容易出错。
因而，基于逻辑的推理，耗时长，效率低。

二，图谱表示
在这一阶段，知识以网络，框架，脚本等形式进行呈现。下面简要介绍下各个知识表示方法的特征。
语义网络：是一个用有向图表示的知识系统，图中节点代表 ”实体，事件，值等“，边代表”两个节点之间的语义关系/属性。
在语义网中，其最小单元为语义基元，用三元组表示即为：<节点1，关系，节点2> or <节点1，属性，节点2>.
无数个语义基元相互链接，即可表示一个完整的知识系统。
用语义网络可以表达很多的关系类型，从宏观到具体，凡是可以用三元组诠释的知识，都可通过语义网络进行描述。
从粒度大小来划分，语义网络中的关系可以分为：
一元关系：即对一事物的属性描述，可以用函数P(x)来表示，如：有翅膀(鸟)。
二元关系：对一对事物关系的表述，可以用函数R(x，y)来表示，如：兄弟(张三，李四)。
多元关系：语义网络中多元关系的表示，可以转为对多个二元关系的组装，对应到语义网络中，即为一个小型网络。

与谓词逻辑(逻辑表示)相比，语义网络具有同等的表达能力，但是，其对知识的表示方式更加简洁，更有利于计算机的存储和检索。虽然语义网络在知识表示方面简化了许多，但是，其知识推理却不及 “逻辑推理” 那样明了，在用语义网络进行知识推理前，首先得理清语义网络中，各种关系的逻辑关系，编写出各种关系的逻辑链条，继而才能进行知识推理。

框架：类似于百度百科中对于 item的描述方式，将item的所有属性都置于列表中，每个单元格可以看作一个槽点，在进行知识表示时，根据Item的属性设置，为每个属性槽点填充 value。
相较语义网络，框架可以表示更为复杂的事实，一个框架即可完成语义网络中需多元关系描述的知识。
在语义网络中，每个节点是一个实体，在框架中，每一个节点相当于一个框架，框架和框架之间，为一种包含被包含，或逻辑上的因果关系，相较语义网络来说，其设定的关系类型抽象性更高，而语义网络中定义的关系类型，即谓词，相当的繁琐，杂乱。

FrameNet是一个经典的基于框架表示的知识库，它常被作为 traindata 用在 NLP任务中，如：
信息抽取：extract the informations from sentences of articles，如，命名实体识别，事件识别，关系识别等等。
文本蕴含：假设有2个文本，A and B，如果从A能推到B，则说A蕴含B。文本蕴含可以视为一个分类任务，f(A，B) -> ture/false。
语义解析：对句子中主，谓，宾，… 等成分进行标注。
角色标注：对于事件中，各种元素进行标注。

脚本：脚本与框架的知识表示形式类似，但是，与框架相比，脚本能够描述事件的时序关系，其描述的是一个动态的过程，而非静态知识的表示。
与语义网络相比，脚本对于元素基本属性的描述能力有限，只适用于一些有特定 schedule 的场景任务。如：酒店预订，机票预定等。

上述介绍的三种知识表示方式：语义网络，框架，脚本都是一种基于槽的表示方法，有所区别的是，槽是否具有层次，时序，控制关系。
语义网络是最简单的一种槽结构，每个三元组都可看成是一个槽结构。
框架则更进一步，可以看成是层次化的语义网络。
而脚本，则是按照一定的时间流程，对事件的发展和变换控制进行的建模。

语义网：
与上述几种知识表示方法相近的是语义网，相较于前者，语义网更加规范，系统，标准化，统一了知识图谱中很多术语的表达，从而使得知识图谱之间的集成成为可能。
语义网知识表示体系主要包括3个层次：XML，RDF，OWL。
XML 相较 HTML 而言，其标签表达更灵活，但由于其标签的个性化，不同的开发人员之间就同一个知识，可能会衍生出多个不同的表示版本，对于公司来说，这无疑增加了系统维护难度，降低了其通用性。
相较 XML，RDF 表达上简洁易懂，且增加通用性的同时，同样可做到与领域无关。但是与XML一样，其仍然存在一个规范化的问题。对于同一个领域，不同的团队可以做出多个版本的 RDF图谱，由于没有统一的术语表达，导致，知识集成变得非常复杂。
OWL与RDF相比，最突出的一点是，其可更为具体的表达限制条件，如：OWL 可以定义值域值有且仅有1个唯一值，但是RDF则无法精确表达值域值的唯一性。

总结一下，语义网相较于语义网络，对节点和边的描述进行了标准化，利用统一的形式对知识进行描述和关联，能更更加方便的进行知识的共享和利用。

三，数值化表示
知识表示的最终目标是为了便于进行语义计算，从而完成知识应用。
逻辑表示，图谱表示两种知识表示方法，其各种概念的种类和关系，都是认为总结的结果，难免遗漏，且无法挖掘未知知识。
而数值表示，则避免了上述两种知识表示方法的缺陷，它通过数值计算来分析各个 item，event,…，等之间的语义关系。
知识的数值化表示经历了两个发展阶段：
step1：特征工程
在这个阶段，工程人员根据自己的以往经验来定义一个Item 由哪些特征进行描述最为合适，其特征选取的好坏直接会影响到机器学习的结果。此外，对于item特征的定义，往往需要相关专业知识，从而进一步限制了机器学习的广泛应用。
step2：词的向量化表示
随着深度学习的发展，人们研究出了词的向量化表示方法，其基本理念认为，上下文相似的词之间其在表意上也很相近。根据这种思想，学者研究出了词数值表示的方法：选取 articles 作为神经网络的训练预料，其学习步骤具体如下：
首先对articles 分句，后对sentences进行分词，制作traindata(x，y)，x可为一句话中的某一词 named as center-word，y可为这个center-word 两边的上下文词组 named as content；
构建神经网络NN，将input定义为 center-word，output定义为content的出现概率;
模型构建完成：center-word -> NN -> content；随机初始化词的向量表示，以及 NN 中的参数，反复迭代，直到loss function 满足条件。此时，各个 word-vector即为其最后的数值化表示结果。
通过组合words-vector，我们可以进一步得到句子的向量化表示，文本的向量化表示…
基于词的向量化表示（词分布表示），我们可以通过词向量间的计算，来判断一段关系是否成立 ?(x，y)，或者填充一段关系中缺失的槽位 R(x，?)。基于此种理念完成知识推理任务。这种推理方式实际上是判断某个词计算结果与候选项间匹配度的过程。

除上述通过词义数值计算的方式，进行知识推理以外，也可通过直接对知识图谱进行数值化表示，而完成推理过程。
知识图谱数值化表示：其方法有2类：张量分解模型，基于能量函数的模型；
张量分解模型：
利用张量分解来数值化知识图谱，并不涉及词的数值化表示，这种方法简单粗暴的将现有知识图谱看作是一个三维矩阵，矩阵中的各个点，值为0或1，代表一种关系在知识图谱中的存在与否，如果知识图谱中有某种关系，则其坐标点的value=1，否则value=0。
基于上述方法构建好三维矩阵X后，对X进行张量分解：X=A’RA，这里的张量分解其实质也是最小化损失函数的过程，首先初始化A 和 R，然后一直迭代更新矩阵值，直到loss=X-A’RA，足够小，此时的A，R 即为 X 的分解结果。
利用计算得到的A，R，重新计算知识图谱的数值表示（三维矩阵），根据各个坐标点的概率值，判断此种关系是否存于知识图谱，借此，完成知识推理。
基于能量函数的模型：
在这种模型中需要用到词的向量化表示，且需定义一个能量函数 f()，通过f(x,y)的计算结果来判定 x,y是否具有关系。
在这一种知识图谱的数值化表示中，其求解量为f()的各个参数。
损失函数可以定义为 loss = | f(+) + r - f(-)|，其中 f(+)为正样本的能量值，f(-)为负样本的能量值，
正样本：知识图谱中的关系对；
负样本：随机shuffle知识图谱中的关系对，生成的非关系对；
训练时，随机初始化f()的各个参数，以生成的正样本，负样本为traindata，反复迭代，直到所求loss 满足定义的 threshold，将此时的参数值作为f()的最终结果。
此时，知识推理过程即转变为对 f(x，y)的求解过程。