自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 知识图谱课程学习-3-3原生图数据库实现原理浅析

原生图是指采用免索引邻接(Index-free adjacency)构建的图数据库引擎,如AllgroGraph,Neo4j等。这种微索引比起全局索引在处理图遍历查询时非常廉价,其查询复杂度与数据集整体大小无关,仅正比与相邻子图的大小。采用免索引邻接的数据库为每一个节点维护了一组指向相邻节点的引用,引用本质上可以看做相邻节点的微索引。

2024-07-03 11:07:39 345

原创 知识图谱课程学习-3-2基于原生图数据库的知识图谱

互联网的开放世界和假设要求数据模型满足高动态和去中心化的扩增数据的能力。关系模型对于表结构的范式要求限制了Schema层的动态性。自然表达:图是非常自然的描述事物关系的方式,更加接近于人脑对客观事物的记忆方式。对于包含大量离群数据的场景,关系模型将造成大量表连接、稀疏行和非空处理。关系数据库的局限性:知识图谱需要更加丰富的关系语义表达和关联推理能力。Neo4J:属性图是图数据库 Neo4J实现的图结构表示模型。复杂的关联表达:图模型易于表达复杂关联逻辑的查询。原生图数据库:利用图的结构特征建立索引。

2024-07-03 11:07:08 406

原创 知识图谱课程学习-3-1基于关系型数据库的知识图谱存储

性能最好的存储方式是基于全索引结构的存储,典型的包括RDF-3X,Hexastore等。图数据库存储并非必须,例如Wikidata项目后端是Mysql实现的。知识图谱的存储需要综合考虑知识结构、图的特点、索引和查询优化等问题。典型的知识图谱存储引擎分为基于关系数据库的存储和基于原生图的存储。二元表也称为垂直划分表。基于关系数据库实现的。Property Tables:属性表存储。最简单的存储:Triple Store。基于传统关系数据库实现。图上的查询语言:SPARQL。知识图谱的各种存储方式。

2024-07-03 11:06:37 224

原创 知识图谱课程学习-2-4知识图谱的向量表示方法

每一个维度都是有数值的,维度远远低于词库大小,通过语料统计学习出来的。称为低维稠密的向量表示,也叫词的嵌入表示。文档向量表示,词出现的次数作为数值,词典大小为文档的大小。缺点:无法表示词的语义。测试三元组(h,r,t):尾实体预测(h,r,?CBow:wordtoword的模型,前几个词和后几个词预测中间的词。通过统计词上下文语义规律,并通过词的上下文计算词的分布式规律。每个词的大小就是词典的大小。词是符号化的,词的语义由它被使用的上下文确定。Skip-gram:中间词预测前后的几个词。

2024-07-03 11:05:57 158

原创 知识图谱课程学习-2-3知识图谱的符号表示方法

关系也可以具有属性,边属性,可以通过在关系上增加属性给图算法提供有关边的元信息,如创建时间等。属性图是由顶点(Vertex)、边(Edge)、标签(Label),关系类型还有属性(Property)组成的有向图。在属性图中节点和关系是最重要的实体,节点上包含属性,属性可以以任何键值形式存在。属性图的缺点是缺乏工业标准规范的支持,由于不关注深层次的语义表达,不支持逻辑推理。属性图是图数据库Neo4J实现的图结构表示模型,在工业界有广泛的应用。属性图的优点是表达方式灵活,如支持为边添加属性。

2024-07-03 11:05:24 358

原创 知识图谱课程学习-2-2人工智能历史发展长河中的知识表示

框架理论的基本思想:认为人们对现实世界中事物的认识都是以一种类似于框架的机构存储在记忆中,当面临一个新事物,就从记忆中找出一个合适的框架,并根据实际情况对其细节加以修改、补充,从而形成对当前事物的认识。描述逻辑是跟知识图谱最接近的表示方法,描述逻辑是一阶谓词逻辑的可判定子集,主要用于描述本体概念和属性,对于本体知识库的构建提供了便捷的表达形式。原子Atoms:P(t1,t2...tn),P是谓词,ti是项(变量或者常量),例如has_child(X,Y)优点:接近自然语言,容易被接受,且易于表示精确知识;

2024-07-03 11:04:57 314

原创 知识图谱课程学习-2-1什么是知识表示

基于离散符号的知识表示:符号表示的缺点:显示知识(不易于刻画隐式知识)、强逻辑约束(依赖于知识表述的精确性)、易于解释、推理不易扩展。基于连续向量的知识表示:用参数化的向量来表示实体与实体间的关系。易于捕获隐式知识,弱逻辑约束、不易解释、对接神经网络。KR不是数据格式、不等同于数据结构、也不是编程语言,对于人工智能而言,数据与知识的区别在于KR支持推理。知识表示:简单而言,知识表示(KR)就是用易于计算机处理的方式来描述人脑的知识的方法。传统的知识表示方法以符号为主。知识的向量表示:促进多种模态的融合。

2024-07-03 11:04:08 241

原创 知识图谱课程学习-1-4知识图谱的技术内涵

知识图谱抽取:概念(Concept)、实体(Entities)、关系(Relation)、事实(Facts)、事件(Events)、规则(Rules)(优点:具有可解释性;问句->语义解析->语义表示(基于符号的表示方法or基于分布式的表示方法)->语义匹配、查询、推理->知识图谱。知识图谱最基本的组成单元是三元组:subject、predicate、object(主、谓、宾)基于图结构或表示学习的方法:PRA、AMIE、TransE、Analogy、表示、存储、抽取、融合、推理、问答、分析、其他。

2024-07-03 10:55:48 349

原创 知识图谱课程学习-1-3知识图谱的价值

辅助视觉理解:知识图谱将视觉识别出的对象链接到外源的知识图谱可以辅助图像语义关系抽取和视觉语义的深入理解。语义搜索、智能问答、推荐系统、辅助大数据分析、辅助视觉理解、语义辅助设备互联。阿里新零售知识图谱、中医药语义网络、大规模故障诊断知识图谱、金融知识图谱。

2024-07-03 10:54:58 254

原创 知识图谱课程学习-1-2知识图谱起源

语义网络(1960)→本体论(1980)→Web(1989)→从超文本链接到语义链接(1998)→链接数据Linked Data(2006)->知识图谱(2012)WordNet:最著名的词典知识库,由普林斯顿大学认知科学实验室研发。Freebase(早期的语义网项目):被谷歌收购。YAGO:德国马普研究所研制的链接数据库。BabelNet:多语言词典知识库。DBpedia:早期的语义网项目。OpenKG.CN:中文知识图谱。WIKIDATA:维基基金会。Schema.org:谷歌。

2024-07-03 10:53:55 196

原创 知识图谱课程学习-1-1知识图谱概论

利用图结构建模、识别和推断事物之间的复杂关联关系和沉淀领域知识,是实现认知智能的重要基石。总结:语言与知识的向量化表示以及利用神经网络实现语言与知识的处理是重要的人工智能技术发展趋势。人类的自然语言,绘画,音乐,数学语言,物理模型,化学公式都是知识的表示形式。抽取技术:从文本中抽取实体、关系、复杂的逻辑结构等。人类心智的最本质特征是获取、表示和处理知识的能力。知识图谱:为每个实体和关系学习一个向量表示。文本预训练:BERT文本知识隐藏在向量中。符号主义:认知,语言,知识->知识图谱。

2024-07-03 10:52:50 173

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除