知识图谱学习笔记(一)—— 知识图谱介绍

1.知识图谱的研究目标与意义

知识图谱(Knowledge Graph)以结构化的形式描述客观世界中概念、实体及其关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。

知识图谱技术是指知识图谱建立和应用的技术,是融合认知计算、知识表示与推理、信息检索与抽取、自然语言处理与语义 Web、数据挖掘与机器学习等方向的交叉研究。

知识图谱的应用:

  • 知识融合:当前互联网大数据具有分布异构的特点,通过知识图谱可以
    对这些数据资源进行语义标注和链接,建立以知识为中心的资源语义集
    成服务。
  • 语义搜索和推荐:知识图谱可以将用户搜索输入的关键词,映射为知识
    图谱中客观世界的概念和实体,搜索结果直接显示出满足用户需求的结
    构化信息内容,而不是互联网网页。
  • 问答和对话系统:基于知识的问答系统将知识图谱看成一个大规模知识
    库,通过理解将用户的问题转化为对知识图谱的查询,直接得到用户关
    心问题的答案。
  • 大数据分析与决策:知识图谱通过语义链接可以帮助理解大数据,获得
    对大数据的洞察,提供决策支持。

2.知识图谱技术

知识图谱以结构化的形式描述客观世界中概念、实体及其关系。

实体:实体是客观世界中的事物,概念是对具有相同属性的事物的
概括和抽象。

本体:本体是知识图谱的知识表示基础,可以形式化表示为,O={C,H,P,A,I}。

C 为概念集合,如事物性概念和事件类概念
H 是概念的上下位关系集合,也称为 Taxonomy 知识
P 是属性集合,描述概念所具有的特征
A 是规则集合,描述领域规则
I 是实例集合,用来描述实例-属性-值

知识图谱可以看做是本体知识表示的一个大规模应用,知识图谱的知识表示结构主要描述客观存在实体和实体的关系,对于每个概念都有确定的描述这个概念的属性集合。

2.1 知识图谱构建

知识图谱与建模
知识表示将现实世界中的各类知识表达成计算机可存储和计算的结构,机器必须要掌握大量的知识,特别是常识知识才能实现真正类人的智能。

知识表示学习
知识表示学习将实体和关系表示为稠密的低维向量,实现了对实体和关系的分布式表示,可以高效地对实体和关系进行计算、缓解知识稀疏、有助于实现知识融合,已经成为知识图谱语义链接预测和知识补全的重要方法。

实体识别与链接
实体是客观世界的事物,是构成知识图谱的基本单位(这里实体指个体或者实例)。实体分为限定类别的实体(如常用的人名、地名、组织机构等)以及开放类别实体(如药物名称、疾病等名称)。实体识别是识别文本中指定类别的实体。实体链接是识别出文本中提及实体的词或者短语(称为实体提及),并与知识库中对应实体进行链接。

实体识别与链接是知识图谱构建、知识补全与知识应用的核心技术。实体识别技术可以检测文本中的新实体,并将其加入到现有知识库中。实体链接技术通过发现现有实体在文本中的不同出现,可以针对性的发现关于特定实体的新知识。实体识别与链接的研究将为计算机类人推理和自然语言理解提供知识基础。

实体关系学习
实体关系描述客观存在的事物之间的关联关系,定义为两个或多个实体之间的某种联系,实体关系学习就是自动从文本中检测和识别出实体之间具有的某种语义关系,也称为关系抽取

实体关系抽取分类预定义关系抽取和开放关系抽取。预定义关系抽取是指系统所抽取的关系是预先定义好的,比如知识图谱中定义好的关系类别,如上下位关系、国家—首都关系等。开放式关系抽取。开放式关系抽取不预先定义抽取的关系类别,由系统自动从文本中发现并抽取关系。

事件知识学习
事件是促使事物状态和关系改变的条件,是动态的、结构化的知识。目前已存在的知识资源(如谷歌知识图谱)所描述多是实体以及实体之间的关系,缺乏对事件知识的描述事件。知识学习,即将非结构化文本文本中自然语言所表达的事件以结构化的形式呈现。

2.2 知识图谱查询和推理计算

知识存储和查询
知识图谱以图(Graph) 的方式来展现实体、事件及其之间的关系。
当前目前知识图谱多以三元存在的 RDF 形式进行存储管理,对知识图谱的查询支持 SPARQL 查询。

知识推理
知识推理从给定的知识图谱推导出新的实体跟实体之间的关系。

知识图谱推理可以分为基于符号的推理基于统计的推理。在人工智能的研究中,基于符号的推理一般是基于经典逻辑(一阶谓词逻辑或者命题逻辑)或者经典逻辑的变异(比如说缺省逻辑)。基于符号的推理可以从一个已有的知识图谱推理出新的实体间关系,可用于建立新知识或者对知识图谱进行逻辑的冲突检测。基于统计的方法一般指关系机器学习方法,即通过统计规律从知识图谱中学习到新的实体间关系。知识推理在知识计算中具有重要作用,如知识分类、知识校验、知识链接预测与知识补全等。

2.3 知识图谱的应用

通用和领域知识图谱
知识图谱分为通用知识图谱领域知识图谱两类,两类图谱本质相同,其区别主要体现在覆盖范围与使用方式上。

通用知识图谱可以形象地看成一个面向通用领域的结构化的百科知识库,其中包含了大量的现实世界中的常识性知识,覆盖面广。领域知识图谱又叫行业知识图谱或垂直知识图谱,通常面向某一特定领域,可看成是一个基于语义技术的行业知识库,因其基于行业数据构建,有着严格而丰富的数据模式,所以对该领域知识的深度、知识准确性有着更高的要求。

语义集成
语义集成的目标就是将不同知识图谱融合为一个统一、一致、简洁的形式,为使用不同知识图谱的应用程序间的交互提供语义互操作性。

常用技术方法包括本体匹配(也称为本体 映射)、实例匹配(也称为实体对齐、对象共指消解)以及知识融合等。

语义搜索
当前基于关键词的搜索技术在知识图谱的知识支持下可以上升到基于实体和关系的检索,称之为语义搜索。语义搜索利用知识图谱可以准确地捕捉用户搜索意图,借助于知识图谱,直接给出满足用户搜索意图的答案,而不是包含关键词的相关网页的链接。

基于知识的问答
问答系统(Question Answering, QA)是指让计算机自动回答用户所提出的问题,是信息服务的一种高级形式。不同于现有的搜索引擎,问答系统返回用户的不再是基于关键词匹配的相关文档排序,而是精准的自然语言形式的答案。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
知识图谱是一种用于表示和组织知识的图形模型,它通过将实体、关系和属性等知识元素以图的形式连接起来,形成一个结构化的知识网络。深度学习则是一种机器学习的方法,通过构建多层神经网络模型来进行自动特征提取和学习。PDF(Portable Document Format)是一种跨平台的文件格式,常用于显示和交换电子文档。 知识图谱与深度学习可以结合使用来更好地处理和利用大规模的文本或语义信息。深度学习可以通过对知识图谱进行训练和学习,提取潜在的语义特征和关联信息,从而实现更高层次的表征和推理。同时,知识图谱可以为深度学习提供更丰富的知识背景和语义约束,使得深度学习具备更强的可解释性和泛化能力。 在研究和应用中,知识图谱和深度学习常常结合起来解决实际问题。例如,在自然语言处理任务中,可以将知识图谱作为先验知识来源,结合深度学习技术进行实体识别、关系抽取和问答系统等任务。在推荐系统中,可以通过深度学习从用户行为中学习用户的兴趣和偏好,然后结合知识图谱中的商品属性和关系进行个性化推荐。 总之,知识图谱和深度学习的结合可以将传统的人工知识和机器学习的能力相结合,促进人工智能技术的发展和应用,对于解决复杂的自然语言理解、推理和推荐等问题具有重要作用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值