提示:之前在bilibil学的那个课程能学到的东西理论太少了,准备跟着网课过一下基础知识,出一下系列;这个系列课程是mooc浙大的知识图谱导论~
弥补一下基础,然后再重回实践
第一章:
知识图谱概述:
·语言与知识
·知识图谱的起源
·知识图谱的价值
·知识图谱的技术内涵
一、语言与知识
传统的人工智能比较典型的两个领域:链接主义和符号主义
二、知识图谱的起源==互联网基因
- ·MEMEX-记忆机器
·超文本技术的发明--实现以链接为中心的系统
·事物之间不应该只有文本链接,应该还有关系链接
eg:
·浙江大学的一个教授在个人主页里面放了浙江大学的链接
·但是互联网是不能根据这个判断这个教授雇佣于浙江大学
- ·提出语义网络
·节点更加细节:可以是一本书、一个作家
·之间的关系可以是雇佣关系和所属关系。。。
·在大数据角度的语义网络:
·利用规范化的语义表示(Schema&Ontology)将碎片化的数据关联和融合
·催生了各种语义网络项目
- ·谷歌知识图谱:(2012)
·能够更精准的获得搜索返回节点,例如直接返回浙江大学所在省份
·典型的知识图谱项目:Freebase、WikiData、Schema.org(关系定义方法)中文领域OpenKG.CN
三、知识图谱的价值
- ·应用1:搜索引擎
Web的理想是链接万物,搜索的理想是万物搜索
- ·应用2:智能问答
类似天猫精灵、siri
对话式的信息获取更加需要精准度和可靠度,知识图谱对于提升用户体验更加不可少
- ·应用3:KG推荐系统
增强user和item的特征表示,有利于挖掘更深层次的用户兴趣,关系多样性也有利于实现更加个性化的推荐,丰富的语义描述
- ·应用4:KG辅助大数据分析
eg:PALATIR
·语义集成:Dynamic Ontology
·语义搜索:围绕Ontology来搜索发现结果和关系
·知识管理:所有的知识是权限控制的
·协作:知识可以在不同的用户之间共享,协同工作
·算法引擎:对于通用领域问题,提供了通用算法来发现趋势
- ·应用5:KG辅助语言理解
- ·应用6:KG辅助视觉理解
·知识图谱在CV领域有广泛的应用,将视觉识别出的对象连接到外源的知识图谱,可用来辅助图像语义关系抽取和视觉语义的深入理解等
四、知识图谱的技术内涵
- ·知识+图谱:两个互补的技术维度
·知识:怎么表示知识和关系
·图谱:考虑图数据、图结构怎么表示知识
- ·更加细分的知识图谱技术要素
·知识图谱技术要素
- ·技术内涵:基于图的知识表示
·有向标记图(Directed-Labled Graph)--最简单、最接近自然语言和人脑认知的数据模型
·RDF图(资源描述框架)
·RDF图包含最基础的三元组(主语、谓语、宾语)
这些三元组首尾链接最后就能链接成知识图谱
- 2.图数据存储与查询
·图数据库充分利用图的结构建立微索引?
·微索引比起关系数据库的全局索引在处理图遍历查询时更加廉价,
·查询复杂度与数据集整体关系大小无关,仅正比于相邻子图的大小。因此在很多设计复杂关联和多跳的场景中广泛应用
- 3.知识抽取
·从不同来源、不同结构的数据中进行知识提取,形成知识存入到知识图谱
·文本一般不作为知识图谱构建的初始来源,而多用来做知识图谱补全
- 4.数据融合
多个来源的实体映射到统一的概念模型当中
·本体概念融合
·实体融合
表示学习是目前主要的技术
- 5.推理技术
·基于符号逻辑的推理方法:OWL Reasoners、Datalog、Rate等
·基于图结构或表示学习的推理方法:PRA、AMIE、TransE、Analogy、DeepPath等
- 6.问答-KBQA
- 7.图算法与图神经网络
知识图谱不是单一技术,做知识图谱需要建立系统工程思维
·数据
·算法
·工具
·系统
多方面考虑
总结
提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。