知识图谱概述

1 什么是知识图谱?

1 智能类型: 计算智能(运算存储能力)、感知智能(人、动物通过感觉器官与自然界交互)、认知智能(人在感知世界以及人与人互动的过程中,形成对世界的理解)、决策职能;

2 知识:经验(experience)、解释(interpretation)、 背景(context)、思考(reflection)结合在一起的信息;

        很多人多知识有不同的解释;

3 知识科学: 研究以知识为对象的基本问题,包括知识的数学理论、逻辑基础以及知识建模、知识获取、知识加工、知识运用的机理。

4 知识工程: 数据+信息 变为 知识;

        数据: 人脑感知的最原始的记录(符号、文字、图像、音频等),未经加工的,与其他数据没有联系;

        信息: 数据经过加工解释的;

        知识:信息重复出现,事物的本质被揭示,信息化为知识;

5 知识库: 对知识进行手机整理,形成形式化表示,按一定方法存储,并提供查询手段;

        知识图谱是知识库的一种形式。

6 知识工程依赖专家构建知识,在受限领域的专家系统中取得成功;

7 大数据知识工程: 大数据时代,信息无法得到充分利用;

        大部分是非结构化数据;标注数据很少;

        大数据中蕴含丰富的知识,迫切需要对大数据进行知识化,让计算机更有效的管理和利用信息。

8 知识图谱起源

        google知识图谱项目;

9 知识图谱:图的结构

        结构化三元组形式存储现实世界中实体及其关系:G = (\varepsilon , R ,S),描述一个特定领域中的事实,由头实体、尾实体和描述这两个实体之间的关系组成;

        \varepsilon = \left\{ e_1,e_2,...e_{|\varepsilon|} \right\} 实体集合;

        R = \left\{ r_1,r_2,..r_{R} \right\}关系集合;

        S \subseteq R*\varepsilon *\varepsilon 三元组集合;

        关系有时也称为属性;

        实体是图结构中的节点,关系是链接两个节点的有向边;

10 知识图谱是大数据知识工程的一种高效模型;

         结构化:图表示数据之间结构的表达形式;

        关联化: 节点的关联和边的关联把多个来源的知识图谱自然关联起来;

        规范化: 采用统一的知识描述框架-- 语义网框架,便于知识的分享和利用;

11 知识图谱以丰富的语义表示能力和灵活的结构构件了在计算机世界中表示认知世界和物理世界中信息和知识的有效载体。

2 知识工程发展历程

1 1950-1970 图灵测试

        符号主义: 物理符号是智能行为的充要条件;

        连结主义: 大脑是一切智能活动的基础;

        通用问题求解程序: 问题形式化+ 搜索;

        知识表示: 数理逻辑、基于逻辑的知识表示、语义网络

1970-1990 专家系统

        知识工程在人工智能的核心地位;

        专家系统= 知识库+ 推理;

        知识表示:框架、脚本、概念依存

        连结主义: 神经网络复苏、BP算法;

1990-2000 万维网

        人工大规模知识库: CYC、WordNet HowNet

        知识表示: 本体

        万维网: web 1.0 W3C 互联网内容标记语言,HTML,XML等

        行为主义: 人工智能是表现出一定智能行为的主体

2000-2006 web 2.0 群体智能

        互联网知识表示方法: 封闭 - 开放; 集中- 分布

        语义网络:互联网内容的结构化表示,实现计算机理解和智能化服务;

        互联网知识表示语言: RDF,OWL

        群体智能知识工程

2006-至今 web 3.0 知识图谱

        知识图谱从通用领域扩展到限定领域

        在工业界大规模应用

        语义搜索、问答机器人、智能知识服务

2 1977 年 提出人工智能概念

        万维网: 采用超文本标记语言,web没有形式化的表示方式,缺乏明确的语义信息,面向人的存储和共享信息的媒介,计算机很难利用。

        语义网: 是万维网的扩展和变革,基于知识本体,对web数据内容进行了规范化的语义标注和关联,从而支持高效的机器信息共享和智能应用;

        本体模型、形式化手段表达数据语义

3 人工智能: 知识数据化,让计算机表示、组织、存储人类的知识;

        互联网: 数据的知识化--让数据支持推理等职能任务

4 人工智能知识表示理论: 依据语义网的技术框架和工程规范,对大数据进行知识化的一个知识工程产品;

        语义网资源描述框架: XML、RDF、RDF Schema、OWL

5 以维基百科尾核心的协同知识资源对于知识图谱的发展起到了决定性作用;

        大规模通用领域知识图谱: freebase, DBpedia 都是维基百科的infebox数据为基础构建而成的;

        真实应用需求;

3 知识图谱类型和代表性知识图谱

1 三元空间:

        物理空间:现实世界

        认知空间: 现实世界在人脑中的反映;

        语言空间: 人们用语言表达认知空间。

2 实体: entity 客观存在并可相互区别的事物,可以是具体的也可以是抽象的;

        关系: 不同的实体之间的各种联系,relation;

        taxonomic relation

        non-taxonomic relation(部分整体、attribute, possession, casuality)

        词语: 用于表示实体、关系这些认知单元的语言单位;

3 Ontology : 本体,一套对客观世界进行描述的共享概念化体系,重点是对数据的定义进行描述,而不是描述具体事物的实例数据;

        Knowledge Base: 知识库,服从于ontology控制的知识实力及其载体

        database: 数据库,计算机科学家为了用电脑表示和存储计算机应用所需要的数据所设计开发的产品;

4 Formal Ontology: 大量使用公理;

        LightWeight Ontology: 较少使用公理。

5 Ontology:本体,共享概念的规范。Ontology通常涵盖概念之间的分类体系,但是除此之外,更重要的是它还有概念之间的相关关系,如反向、传递、对称等,以及在此基础上建立的推理规则,从而支持复杂推理。由于具有严格的规范,一般用户难以构建。

        Taxonomy:分类法,或称分类体系,是由专家编制的专业层次类别体系,如中图分类体系等。也有一些不严格的分类体系,通常由一些组织为了自身需要而编制,如Yahoo分类目录等。

          Folksonomy:社会分类法,是由用户的自由标签自动形成的一种分类法,在对同一事物进行标签的所有标签中,取出高频标签作为分类标签。严格讲,是一种标签方法,并不一定构成一个分类体系。另一方面,标签具有随意性(歧义性)。

6 知识类型: 语言知识(缩写,同义词等)、百科知识(人物、机构、地点)、 场景知识(特定场景下要完成某项任务要具备的知识)、领域知识(法律知识、金融知识等)、常识知识

7 知识图谱类型:

        语言知识图谱:wordnet

        常识知识图谱: Cyc,Hownet, ConceptNet;

        语言+ 百科知识图谱: Yago, Babelnet

        百科知识图谱: DBpedia, freebase, Google KG,Wikidata

        领域知识图谱: 医学SIDER,电影IMDB,音乐MusixBrainz

8 代表性知识图谱介绍

1 wordNet:

        普林斯顿大学建立的英文词汇语义知识库;

        理论基础:语义场理论(上下义义场、整体与部分、同义、反义)

 

 

人工标注,英文单词按照语义组成大的概念网络;

 

146350个单词,111223个同义词集

2 FrameNet

        1997年开始,Berkeley 构建的词汇语义知识库

        理论基础: 语义学理论

        认为大部分的语义能够通过语义框架(对词语涵盖的概念知识预设)形式表

        具有层级的组织结构

3 知网—— HowNet

        不是将所有概念归结到一个树状的概念层次体系中,而是试图用一系列义原对每一个概念进行描述,义原之间通过义原关系进行关联。

        功能,受事

4 参考文献: 国科大-知识图谱课件

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值