知识图谱基本概念

1.1 知识图谱定义与发展历程

知识图谱在维基百科的定义:使用语义检索,从多种来源收集信息,以提高搜索质量的知识库。

1965年,斯坦福大学的E.A.Feigenbaum提出专家系统的概念,基于知识进行决策,使人工智能的研究从推理算法主导转变为知识主导。

1968年,M.R.Quillian提出语义网络的知识表达模式,用相互连接的节点和边来表示知识,知识库的构建和知识表示方法成为研究热点。

1977年,在第五届国际人工智能联合会议上,E.A.Ferigenbaum提出知识工程概念,以知识为处理对象,基于人工智能的原理、方法和技术,研究如何用计算机表示知识,进行问题的求解。

1989年,Tim Berners-Lee发明了万维网,并于1998年提出语义网概念,将传统人工智能的发展与万维网结合,以资源描述框架为基础,在万维网中应用知识表示与推理方法。

2012年,Google提出了知识图谱的概念。不同传统专家系统和知识工程主要依靠手工获取知识的方式,以RDF三元组和属性图表示知识,数据规模巨大,需要使用机器学习、自然语言处理等技术进行自动化的图谱构建。

1.2  知识图谱分类

1.2.1  早期知识库

早期知识库由相关领域专家人工构建,构建构成复杂,典型包括WordNet、ConceptNet等。WordNet是由普林斯顿大学认知科学实验室从1985年开发的词典知识库,主要用于词义消歧。ConceptNet是一个常识知识库,源于麻省理工学院媒体实验室在1999年创立的OMCS项目,以三元组形式的关系型知识构成。

1.2.2  开放知识图谱

开放知识图谱类似于开源社区的数据仓库,允许任何人在遵循开源协议的前提下对知识库进行访问、修改和共享,典型包括Freebase、Wikidata等。Freebase是MetaWeb从2005年开始研发的开放共享的大规模链接知识库,基于RDF三元组模型,底层采用图数据库存储。Wikidata是一个开放、多语言的大规模链接知识库,以三元组形式存储知识条目,其中每一个三元组代表一个条目的陈述。

1.2.3  中文常识知识图谱

与英文百科数据相比,中文百科数据结构更为多样,语义内涵丰富,包含结构化和半结构化数据有限,为知识图谱提出更大的挑战。中文知识图谱主要代表Zhishi.me、CN-DBpedia等。Zhishi.me采用与DBpedia类似的方法,从百度百科、互动百科和维基百科中提取结构化知识,通过固定的规则将它们之间的等价实体链接起来。CN-DBpedia是一个大规模的中文通用知识图谱,由复旦大学于2015年开始研发,其从中文百科类网站中提取信息,并且对提取的知识进行整合、补充和纠正。

1.2.4  领域知识图谱

领域知识图谱面向军事、公安、交通、医疗等特定领域,用于复杂的应用分析或辅助决策,具有专家参与度高、知识结构复杂、知识质量高、知识粒度细等特点。典型的领域知识图谱包括IBM Watson Health医疗知识图谱、海致星图金融知识图谱、海信“交管云脑”交通知识图谱等。

1.3 知识图谱架构

知识图谱在架构层面分为模式层和数据层,如下图。

知识图谱逻辑结构表

逻辑结构层次主要内容示例
模式层知识类的数据模型概念及关系
数据层具体的数据信息事实三元组

1.3.1  知识图谱模式层

模式层在数据层之上,是知识图谱核心,主要内容是知识图谱的数据结构,包括实体、关系、属性等知识类的层次结构。

1.3.2  知识图谱数据层

数据层是以事实三元组等知识为单位,知识图谱一般以三元组G={E,R,F}的形式表示。其中,E表示实体集合,R表示关系集合,F表示事实集合,每一个事实f被定义为一个三元组(h,r,t)∈f。其中,h表示头实体,r表示关系,t表示尾实体。

在事实中,实体一般指特定的对象或事物,如具体某个国家或某本书籍等;关系表示实体间的某种外在联系;属性和属性值表示一个实体或概念特有的参数名和参数值。

三元组可表示为有向图结构,单箭头表示非对称关系,双箭头表示对称关系,如下图。

 单向箭头可以表示实体的属性,由实体指向属性值,如下图。

 综上所述,知识图谱可看作事实的结构化表征,包括事实的实体、关系、属性以及语义描述。

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值