【知识图谱】综述

知识图谱研究进展 机器之心https://www.jiqizhixin.com/articles/2017-03-20

知识图谱构建
· 关键技术:实体关系识别技术、知识融合技术、实体链接技术、知识推理技术等
· 目的:获得大量的、让计算机可读的知识
· 三个部分:
(1)知识获取:从非结构化、半结构化、结构化数据中获取知识
(2)数据融合:将不同数据源获取的知识进行融合,构建数据间的关联
(3)知识计算及应用:基于知识图谱计算功能及应用
构建知识图谱的技术地图
(1)知识获取
1.非结构化数据 (文本数据)
提取正文(过滤广告,保留用户关注的文本内容)=》自然语言技术识别文章中的实体
2.半结构化数据(表格、网页等)
包装器学习半结构化数据的抽取规则
3.结构化数据(存储在数据库中的数据)
ETL工具(extract-transform-load,抽取-转换-加载)对数据进行重新组织、清洗、检测

(2)知识融合
本体:提供统一术语的结构或者数据,构建各个术语之间的关系及其限制。
· 通过数据映射技术建立本体中术语和不同数据源抽取知识中词汇的映射关系,进而将不同数据源的数据融合在一起。
· 使用实体匹配将不同数据源相同客体的数据进行融合
· 使用本体融合技术将存在某些术语描述同一类数据的不同本体融合

[1] 徐增林, 盛泳潘, 贺丽荣,等. 知识图谱技术综述[J]. 电子科技大学学报, 2016, 45(4):589-606.

web 1.0:文档互联
web 2.0:数据互联
web 3.0:知识互联(目标:构建一个人与机器都可理解的万维网,使得网络更加智能化)

知识图谱(knowledge graph)
用本体模型来形式化表达数据中的隐含语义。RDF(resource description framework)、万维网本体语言(Web ontology language,OWL)
应用:智能搜索、智能问答、个性化推荐等
(智能搜索 发展:不再局限于关键词匹配,根据用户查询的情境与意图进行推理,实现概念检索)
优势:能够使计算机理解人类的语言交流模式,更加智能地反馈用户需要的答案;能够将Web上的信息、数据以及链接关系聚集为知识,使信息资源更易于计算、理解以及评价,形成一套Web语义知识库。

  • 1.1 知识图谱的定义
    Google用于增强其搜索引擎功能的知识库。
    · 本质:一种揭示实体之间关系的语义网络,可以实现对世界的事物及其相互关系进行形式化的描述。泛指各种大规模的知识库。
    · 表示方式:三元组 G=(E,R,S)
    E=e1,e2,...,e|E| 表示知识库中的实体集合,共有 |E| 种不同实体
    R=r1,r2,...,r|R| 表示知识库中的关系集合,共有 |R| 种不同关系
    SE×R×E 表示知识库中的三元组集合
    · 三元组的基本形式包括实体1、关系、实体2和概念、属性、属性值等
    -实体:知识图谱中的最基本元素,不同的实体间存在不同的关系
    -概念:主要指集合、类别、对象类型、事物的种类(eg 人物、地理等)
    -属性:对象可能具有的属性、特征、特性、特点以及参数(eg 国籍、生日等)
    -属性值:对象指定属性的值(eg 中国、1998-01等)
    每个实体可用一个全局唯一确定的ID标识
    每个属性-属性值对(attribute-value pair, AVP)可用来刻画实体的内在特性
    关系用来连接两个实体,刻画它们之间的关联

  • 1.2 知识图谱的架构
    (1)逻辑结构<数据层、模式层>
    · 数据层:由一系列事实组成,知识将以事实为单位进行存储
    eg 事实:(实体1,关系,实体2)、(实体,属性,属性值)
    存储介质:图数据库(如Neo4j、FlockDB等)
    · 模式层:构建在数据层之上,通过本体库来规范数据层的一系列事实表达
    本体:结构化知识库的概念模板(由本体库形成的知识库层次结构强,冗余程度小)
    (2)体系架构<构建模式结构>
    构建方式:
    · 自顶向下(top-down):先为知识图谱定义好本体与数据模式,再将实体加入到知识库
    · 自底向上(bottom-up):从一些开放链接数据中提取出实体,选择其中置信度较高的加入知识库,再构建顶层的本体模式(大多知识图谱采用此方式进行构建,如google的Knowledge Vault)

  • 2 大规模知识库

  • 未完。。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 知识图谱(Knowledge Graph)是一种用于表示和存储大规模结构化和半结构化数据的图形数据库。它将实体、关系和属性组织在一张图中,并通过丰富的语义关系连接起来。知识图谱的构建和使用已经在各个领域中得到了广泛的应用。 2019年的ICDM(International Conference on Data Mining)上,关于知识图谱的研究和应用有许多重要的进展和综述。这些综述主要涉及以下几个方面: 1. 知识图谱构建方法:综述中介绍了多种知识图谱构建方法,包括基于文本挖掘的方法、基于结构化数据的方法和基于众包的方法等。这些方法能够从不同的数据源中提取实体、关系和属性,并将其组织成一个完整的知识图谱。 2. 知识图谱表示学习:综述中介绍了知识图谱表示学习的方法,包括传统的基于矩阵分解的方法和最新的基于深度学习的方法。这些方法能够将知识图谱中的实体和关系映射到低维向量空间中,以便进行后续的数据分析和推理。 3. 知识图谱应用:综述还介绍了知识图谱在不同领域中的应用,例如自然语言处理、推荐系统和智能问答等。这些应用能够从知识图谱中获取更丰富的信息,并对用户的需求进行更准确的响应。 总的来说,知识图谱综述2019 ICDM反映了知识图谱领域的最新研究和发展趋势。通过了解和应用这些研究成果,我们可以更好地利用知识图谱来解决实际问题,推动人工智能和大数据的发展。 ### 回答2: 知识图谱是一个用于表示和组织大规模信息的结构化知识库,它以图的形式将实体、关系和属性表示为节点和边。它的目标是提供一个计算机可理解的知识表达形式,以帮助机器理解和推理人类知识。近年来,知识图谱在信息检索、问答系统、社交网络分析等领域取得了显著的进展。 2019年icdm(IEEE International Conference on Data Mining)上,对知识图谱的研究进行了广泛综述。研究者们关注了知识图谱的构建、表示学习、推理和应用等方面。 首先,研究者们讨论了知识图谱的构建方法。这包括自动从结构化和非结构化数据中抽取实体、关系和属性,以及采用人工注释和知识编辑的方式进行构建。还有一些研究致力于解决构建中的挑战,如噪声数据处理、实体消歧和关系抽取等。 其次,关于知识图谱表示学习的研究也被广泛涵盖。这些方法旨在将知识图谱中的实体和关系映射到低维向量空间,从而捕捉它们之间的语义关系。一些流行的方法包括基于图卷积网络(Graph Convolutional Networks, GCN)和深度生成模型(Deep Generative Models)的表示学习方法。 此外,知识图谱的推理方法也是icdm研讨的重点。推理可以通过图匹配、规则推理和基于规则的推理等方式来实现。这些方法可以帮助发现实体之间的隐藏关联和新的知识。 最后,icdm还关注了知识图谱在各种应用领域的应用。这包括推荐系统、信息检索、问答系统、社交网络分析等。研究者们探索了如何使用知识图谱的结构化表示来提高这些领域中的性能。 综上所述,2019 icdm对知识图谱的研究进行了广泛综述,涵盖了从构建到推理的各个方面,并展示了知识图谱在不同应用领域的潜力和前景。 ### 回答3: 知识图谱是一种能够存储和表示知识的图形化数据结构,它通过将知识组织成实体、属性和关系的形式来描述现实世界中的事物和概念。而2019年的ICDM(International Conference on Data Mining)会议就是在这一领域进行的重要学术会议之一。 2019年ICDM知识图谱方向的研究主题包括但不限于知识图谱的构建、表示和推理。首先,研究人员关注如何有效地构建大规模的知识图谱。这涉及到对知识源的挖掘和知识抽取技术的应用,以从不同的元数据中自动提取和整合实体、属性和关系。 其次,关于知识图谱的表示方法是研究的重点。学者们致力于寻找有效的表示方法,以将知识图谱映射到低维空间中,从而能够更好地支持各类图谱相关的任务,如检索、推荐和分类等。此外,还有一些学者关注于如何利用深度学习和图神经网络等高级模型来提升知识图谱的表示能力。 最后,推理技术知识图谱中也起到重要作用。知识图谱推理能够通过检测图谱中的潜在推理规则和模式,从中获得新的知识。这项研究的目标是能够自动发现和推理出更多的隐藏知识,从而拓展和完善知识图谱的内容。 综上所述,2019年ICDM会议以知识图谱为主题,聚焦于知识图谱的构建、表示和推理等方面的研究。这些研究对于促进知识图谱的发展和应用具有重要意义,将为相关领域的学术研究和实践应用提供新的思路和方法。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值