知识工程重点知识介绍-3

SPARQL的四种查询方式

SELECT

单三元组模式、最简单的图模式
查询张三认识的其他程序员
PREFIX ex:<http://www.example.com/>
	SELECT ?p
	WHERE{ex:zhangsan ex:know ?p.}

抽象来看
SELECT <variable>
WHERE{
	<graph pattern>
}

说明:

  1. SPARQL的变量以?开始;
  2. 三元组模式;
  3. SELECT能够返回满足条件的变量的TABLE;

在这里插入图片描述

返回FOAF文件中每个人的URI、名字和邮箱地址。
PREFIX foaf:<http://xmlns.com/foaf/0.1/>
SELECT *
WHERE
{
?person foaf:name ?name.
?person foaf:mbox ?email.
}

*会选取所有在查询中提及的变量。
多三元组查询、基本图模式
查询程序员张三认识的其他程序员参加的项目
PREFIX ex:<http://www.example.com/>
	SELECT ?pr
	WHERE{
		ex:zhangsan ex:knows ?p.
		?p ex:participate ?pr.
}
输出:
ex:graphdb
ex:triple

这是由两个三元组模式组成的一个基本图模式查询,简称为BGP查询。这两个三元组通过一个公共变量?p连接为一个链式查询。
请添加图片描述
这里注意一下这个指定了目标图哦。

下面这个意思是:找一下那些参与过三次ISWC或ESWC会议的人。
请添加图片描述
a表示有属性。

在三个不同的图中,找到?person
请添加图片描述
knows/name表示先找到x认识的人,再找到他的名字。这称之为一跳。
+表示knows经历了多跳。

CONSTRUCT

请添加图片描述
返回以模板形式构建的集合,其中变量被查询的内容所替换。

ASK

请添加图片描述

DESCRIBE

请添加图片描述
请添加图片描述
返回的是与P2556相关的全部三元组,而不简简单单是P2556。

Cypher查询语言

属性图

请添加图片描述

形式化定义:

  1. 节点:图中的实体,用表示其类型的0到多个文本标签进行标记,相当于实体;
  2. 边:节点之间的定向连接,也称为关系。每条边都有一个类型,相当于实体之间的关系;
  3. 属性:键值对,顶点和边都有属性。

Cypher概述

名词解释实例
节点()表示节点(n:Person)表示使用变量n引进了Person节点
关系-表示无方向关系;->,<-表示有方向关系(:Person)->(:Animal)表示人这个实体和动物实体之间的关系
关系描述[]描述关系详情(:Person)-[:relation]->(:Animal)表示这个relation表示人和动物的关系
属性描述{}描述属性(:Person{name:“张三”})描述姓名为张三的Person节点

Cypher查询语句

# 查询Dept下的内容
MATCH (dept:Dept) return dept
# 查询Employee标签下id=123,name=“Lokesh”的节点
MATCH(p:Employee{id:123,name:"Lokesh"}) return p
# 查询Employee标签下name="Lokesh"的节点,使用(where)
MATCH(p:Employee)
WHERE p.name = "Lokesh"
return p

基本查询:
请添加图片描述
关注非空的写法。

请添加图片描述
分别是:改数据、降序排序、只输出两个、取值集合。

请添加图片描述
分别是:单标签、多标签、特定属性($表示一个类型)、任意无方向(区别于有方向)关系(关系)。
请添加图片描述
分别是:特定无方向关系、无方向或关系、特定无方向关系及标签、任意无方向但有关系(节点)
请添加图片描述
分别是:任意有方向关系(节点)、有方向的单层关系、有方向的多层(取值范围)关系
请添加图片描述
最后是:两个关系。
请添加图片描述

请添加图片描述
请添加图片描述

OPTINAL MATCH语句⽤于搜索模式中描述的匹配项,对于找不到的项⽤null。

match (n {name: 'aaa'}) 
optional match (n) --> (b) 
return b, b.name

如果b存在就返回b, 否则返回null

对于不存在的b, 尝试返回b的属性返回的也是null

with作为管道将查询结果从一部分以管道形式传递给另一部分作为开始点。第2行的r被第3行的r筛选出来传递给第4行。

count则能返回每个s 的数量。

Q13:问答系统的发展史及不同时期的代表系统或平台

请添加图片描述
请添加图片描述

Q14:知识库问答的三种常见方法(基本原理)及优缺点

问答系统概述

问答形式的类型:一问一答、交互式问答以及阅读理解。

问答系统的框架
请添加图片描述
构造query及构造查询语句。

问答系统的流程
请添加图片描述

问答系统的基本概念描述
问句短语问句短语定义问的是什么:who/what/which/when/where/why/how
问题类型问题类型决定后续采用什么样的回答处理策略
答案类型常见的有:事实性、摘要性、描述性
问题主题问题是关于什么方面的
答案来源类型数据源
领域类型数据类型(文本、图片、音频、视频);开放域、特定淤

知识库问答方法

基于模板的问答方法(TBSL)

请添加图片描述

pos tag表示语义标签。

请添加图片描述

通过语义标签与领域相关性词汇找到关键词,然后以此为依据构建三元组。

这里一共有两种模板,一个表示的是:x导演了y,y是电影;另一个表示的是:x的电影有y。

请添加图片描述
我有了这个模板,模板里面也有了一些名词,但这个名词还需要和知识库中的名词建立对应关系。最后在模板中的属性还得是知识库中的实体。

请添加图片描述

请添加图片描述
请添加图片描述

优点缺点
模版查询响应速度快人工定义的模版结构经常无法与真实用户问题进行匹配
准确率较高,可以回答相对复杂的问题如果为了尽可能匹配上一个问题的多种不同表述,则需要建立庞大的模板库,耗时耗力且查询起来效率低

基于语义解析的方法

主要思想是将自然语言转化为一系列形式化的逻辑形式,通过对逻辑形式进行自底向上的解析,得到一种可以表达整个问题语义的逻辑形式,之后通过相应的查询语句,在知识库中进行查询,从而得到答案。

请添加图片描述
首先检测问句中的关键短语,然后资源映射到数据库中,接着构建起逻辑表达式,最后转化为查询语句,经过查询得到最后的结果。

请添加图片描述
请添加图片描述
请添加图片描述
上面两幅图介绍了资源映射的基本概念,然后介绍了两个映射方法。
请添加图片描述

请添加图片描述

语义解析的过程是通过一个分类器完成,这是一个监督学习的过程,需要提前准备好数据集。

基于深度学习的问答方法

三种方法的比较

方法优点缺点
模板查询响应快、准确率高,可以回答相对复杂的问题人工定义模板费时费力,且经常无法与用户真实问题匹配
语义解析可以回答较为复杂的问题,例如时序性问题人工编写规则工程量大
深度学习无需人工编写规则定义模板,整个学习过程自动进行只能处理简单题和单边关系问题,通常不包含聚类操作,因此时序性问题无法应对

Q5:Elasticsearch系统和gAnswer系统的主要算法框架及优缺点

Elasticsearch

系统功能

不是专门用来做知识问答的系统,是一个比较成熟的搜索和数据分析引擎。借助Elasticsearch强大的搜索功能,可以实现简单的知识问答。其主要基于以下四个功能实现:

  1. 基于实体检索的回答;
  2. 基于实体属性检索的回答;
  3. 基于多跳查询的回答;
  4. 根据属性值查询实体的回答。

请添加图片描述
根据实体,找到属性。
请添加图片描述
根据实体和属性找到属性。
请添加图片描述
多对实体属性组合,找到目标。
请添加图片描述
根据属性,找到实体。

知识问答流程

基于Elasticsearch的知识问答主要包括以下四个步骤:

  1. 数据准备:将数据集转化为JSON格式,必要时可进行属性同义词扩展;
  2. 导入Elasticsearch:在Elasticsearch中创建index和type索引,并导入JSON数据;
  3. 自然语言转化为Logical form:解析自然语言,生成logical form;
  4. Logical form翻译成ES查询语句:生成ES查询语句,并执行查询。

请添加图片描述
请添加图片描述
请添加图片描述
根据问题判断对应使用的模板,填充之后构成logic form。
请添加图片描述
将logic form填入对应的ES模板,并从ES中开始查询。

优缺点

优点缺点
分布式索引(索引index是一组文档的集合)、搜索只支持简单的自然语句查询,对于复杂的问题无法回答
索引自动分片(ES是分布式搜索引擎,所以索引被自动分配在不同的地方)、负载均衡在添加新数据和新字段时,ElasticSearch进行搜索可能需要重新修改格式
自动发现机器、组成集群(多个节点组成的小群体)ElasticSearch是基于符号逻辑的,符号的匹配会造成语义鸿沟(机器和人类的理解差距)的问题
支持Restful风格接口-
配置简单-

gAnswer

系统功能

主要解决RDF Q/A的以下两个挑战:

  1. 语义消岐(资源映射):如何将自然语言中具备歧义的实体短语和关系短语对应到知识库中确定的实体和谓词上;
  2. 查询构建(语义组合):如何将映射后的实体和谓词拼接为一个完整的SPARQL查询。

解决方案:

  1. 消岐和查询评估结合起来,具体来说,在查询匹配时解决自然语言问题的歧义。如果找不到匹配项将节省消除歧义的成本。
  2. 构建了一个表示用户查询意图的查询图,允许在问题理解阶段出现歧义。解决了在查询评估中找到匹配项的模糊性。

请添加图片描述
问句解析(问题-语义查询图):从问句中提取关系、实体。即建立依赖树,然后通过自己的方法从里面提取出关系和实体。
答案查询(语义查询图-查询):在查询图中每个结点和每个边都有候选实体和关系。首先得到每个结点和候选者之间的相似度,然后进行子图匹配。(语义消岐、查询构建)

系统框架

使用两个数据驱动框架将消岐和查询评估结合在一起:

  1. 关系优先框架,解决了查询评估中短语链接的歧义;
  2. 节点优先框架,短语链接和查询图形结构的模糊性都得到了解决。

构建方式:
请添加图片描述
查询方式:
请添加图片描述

请添加图片描述
请添加图片描述

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述

优缺点

优点缺点
在问题理解阶段允许短语和结构的歧义,将消除歧义推到查询评估阶段难以解决复杂问题
有效地解决了模糊问题-

Q16:传统推理的三种形式

  1. 演绎推理;
  2. 归纳推理;
  3. 溯因推理。

演绎推理

从一般到特殊的推理方法,与归纳法相对。

其形式有:

  1. 三段论:以一个一般性的原则(大前提)以及一个附属于一般性的原则的特殊化称述(小前提),由此引申出一个符合一般性原则的特殊化陈述(结论)的过程。
  2. 假言推理:是以假言判断为前提的推理。假言推理分为充分条件假言推理和必要条件假言推理两种。这种推理与三段论有相似之处但却不是三段论。
    前者的基本原则是:小前提肯定大前提的前件,结论就肯定大前提的后件;小前提否定大前提的后件,结论就否定大前提的前件。
    后者的基本原则是:小前提肯定大前提的后件,结论就要肯定大前提的前件;小前提否定大前提的前件,结论就要否定大前提的后件。
  3. 选言推理、关系推理(不在此赘述)。
    请添加图片描述

归纳推理

请添加图片描述

溯因推理

请添加图片描述
从结果出发,推测事情发生的原因的过程。

我们首先知道了假设,之后观察到了结果,此时推断出原因。

三者可表述为:

  1. 演绎推理:已知规则、前提,推测出结果;
  2. 归纳推理:已知前提、结果,推测出规则;
  3. 溯因推理:已知规则、结果,推测出前提(原因)。

必要性假言推理看着和溯因推理差不多,但是溯因推理得到的原因并不是确定的。

三段论看着和假言推理差不多,但是三段论给出的前提更加抽象。

Q17:基于规则的推理算法之归纳推理算法PRA和AMIE

知识图谱的推理任务

请添加图片描述
判断关系的正确性以及推断关系是知识推理的主要任务。
请添加图片描述

PRA和AMIE属于基于规则推理中的归纳推理方法。

PRA:路径排序算法

请添加图片描述

PRA是一种将关系路径作为特征的推理算法,经常用于知识图谱中的链接预测任务。其获取的关系路径实际上对应着一种霍恩子句,因此PRA计算的路径特征可以转换为逻辑规则。

其思想是通过发现连接两个实体的一组关系路径来预测实体间可能存在的某种关系。

请添加图片描述

请添加图片描述
请添加图片描述

有点像感知机, ω \omega ω为每一个路径的权重组合的向量, x x x为路径组成的特征。

AMIE(基于不完备知识库的关联规则挖掘算法)

请添加图片描述

请添加图片描述

请添加图片描述

  1. q是一个规则库,首先我们对它进行初始化;
  2. 进入循环,从q中取出一个规则,如果这个规则没有封闭,就把这个规则添加进去;
  3. 然后将所有运算符对这个规则使用,产生的新规则添加到q中;
  4. 重复此过程,直到队列为空。

Q18:基于嵌入式表示的推理之距离模型及优缺点

TransE

TransE模型的原理在先前已经提及,这里只在一次介绍其问题:

  1. 自反性问题:如果关系 r r r具有自反性,即 ( h , r , t ) , ( t , r , h ) ∈ G (h,r,t),(t,r,h)\in G (h,r,t),(t,r,h)G,那么根据TranE模型可以推测出 h = t , r = 0 h=t,r=0 h=t,r=0
  2. 不适合处理一对多,多对一问题,这在之前已经提及。

请添加图片描述
一个实体,根据一个关系对应多个实体,那么这些实体会近乎一致。

TranH

TranH主要解决的是1-to-Many、Many-to-1和Many-to-Many的问题。

比如说:谈论国籍时,莎士比亚和牛顿应该是接近的(人,英国,莎士比亚)(人,英国,牛顿);谈论职业时,前者应该和马克吐温接近(人,作家,莎士比亚)(人,作家,马克吐温)。如果还是用TranE模型,牛顿和马克吐温就会凑一块,这是不合理的。

TransH通过为具有不同关系的相同实体赋予不同的向量表示来解决这个问题。

请添加图片描述
TransH为每个关系赋予一个超平面 w r w_r wr,然后判断超平面上的相似性。 d r d_r dr就是正常的关系。

另外,损失函数和训练方式同TransE。

TransR

TransH通过使用超平面的方式为具有多个关系的实体赋予不同的向量表示,但是实体和关系仍然在相同的语义空间,这限制了建模实体和关系的能力。

TransR认为不同的关系应该有不同的语义空间,因此为每个关系构造相应的向量空间。对每个三元组,首先应该将实体投影到对应的关系空间中,然后再建立从头实体到尾实体的翻译关系。

请添加图片描述

TransC

请添加图片描述
请添加图片描述
实例和概念之间的关系、概念和子概念之间的关系、实例和实例之间的关系。

相比于传统的Trans E、H、R,TransC将实体区分为了概念和实例,并进一步细化了这些关系。

概念抽象为了一个圆。根据实体与概念、概念与概念间的不同关系对应着不同的得分函数。
请添加图片描述

优缺点

请添加图片描述

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
最近几年,例如YAGO和DBpedia等大规模知识库发展有了很大的进步。知识库提供了大量的不同种类的实体信息,如人、国家、河流、城市大学等等,同时知识库包含了大量的在实体(entity)间的关系既事实(fact)。当今的知识库包含的数据量是巨大的通常有百万个实体和上亿个描述实体间关系的事实数据。 虽然目前的知识库存在大量的实体和事实数据,但是这样大规模的数据仍然不完整。目前构建知识库的方法主要有两种,一种是从大量的文本中抽取事实但这种方法必然会带来大量的噪声数据,第二是人工扩展,但这样的方法对于时间的开销是极大的。如果确保一个知识库是完整的则必须花费很大的努力来抽取大量的事实,并检查事实的正确性,因为只有正确的事实加入到知识库中才是有意义的。同时知识库的本身由于有足够的信息可以推理出更多的新的事实。例如有这样一个例子,一个知识库包含一组事实是孩子c有一个妈妈m,这样可以推理得出孩子妈妈的丈夫f很可能是孩子的父亲。该逻辑规则形式化的描述如下: motherof(m,c)∧marriedTo(m,f)⟹fatherof(f,c) 挖掘这种规则可帮助做一下四种事情:1、利用这种规则来推理出新的事实,而这些被挖掘出的新的事实可以使知识库更完整。2、这些规则可以检测出知识库潜在的错误例如一个陈述是一个与一个男孩无关的人是这个男孩的父亲,这样的陈述很可能是错误的。3、有很多推理工具依赖其他工具提供规则,所以这些被挖掘出来的规则可以用于推理。4、这些规则描述一个普遍的规律,这些规律可以帮我我们理解分析知识库中的数据,如找到一些国家通常与说同一种语言的国家交易。或结婚是一个对称关系,或使用同一个乐器的音乐家通常互相影响等等。 AMIE的目标是从RDF格式的知识库中挖掘如上所述的逻辑规则,在语义网(Semantic Web)中存在大量的RDF知识库如YAGO、Freebase和DBpedia等。这些知识库使用RDF三元组(S,P,O)提供二元关系(binary relation)的描述。由于知识库一般只包含正例而(S,P,O)没有反例(S,¬P,O),所以RDF这样的知识库中仅能通过正例来推理。进一步来说在RDF知识库上的操作是基于开放世界假设(OWA)的。在开放世界假设下,一个事实没有在知识库中存在那么我们不能说这个事实是错误的,只能说这个陈述是未知的。这与标准的数据库在封闭世界假设的设定有本质上的区别。例如在知识库中没有包含marry(a,b),在封闭世界假设中我们可以得出这个a没有和b结婚而在开放世界假设下我们只能说a可能结婚了也可能单身。 压缩包内包含AMIE可运行源代码与相应文档资料,欢迎下载参考
智能制造工程是一门涉及到多个领域的学科,其中主要涉及到以下几个重点知识: 1. 数字化制造:数字化制造是智能制造的核心内容,主要包括CAD/CAM/CAE技术、数字化仿真与虚拟制造、数字化加工控制技术等,旨在实现生产过程的数字化、智能化和自动化。 2. 先进制造技术:先进制造技术是智能制造的重要组成部分,主要包括增材制造技术、激光加工技术、微纳加工技术、柔性制造技术、智能控制技术等,旨在实现生产过程的高效、精密和柔性化。 3. 生产流程优化:生产流程优化是智能制造的重要手段,主要包括流程设计、作业分析、作业改进、生产线平衡等,旨在实现生产过程的高效、稳定和可持续发展。 4. 智能制造系统:智能制造系统是智能制造的关键环节,主要包括MES、ERP、PLM等系统,旨在实现生产过程的信息化、智能化和可追溯性。 5. 人工智能技术:人工智能技术是智能制造的重要支撑,主要包括机器学习、深度学习、自然语言处理、图像识别等技术,旨在实现生产过程的自主决策、自适应控制和自我学习。 6. 物联网技术:物联网技术是智能制造的重要基础,主要包括传感器技术、通信技术、云计算技术等,旨在实现生产过程的数据采集、数据传输和数据处理。 以上是智能制造工程重点知识,对于从事智能制造工程的专业人士来说,需要掌握这些知识,并不断更新和拓展自己的知识面,以适应智能制造领域不断变化的需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

右边是我女神

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值