一、语言与知识
人工智能起源时的两个流派: 联结主义和符号主义
两种方式的人工智能对于实现真正的人工智能缺一不可
语言是知识最直接的载体,人类绝大部分的知识都是通过语言来描述、记录和传承的
人类的自然语言,以及创作的绘画和音乐、数学语言、物理模型、化学公式等都是人类知识的表式和传承方式。
具有获取、表示和处理知识的能力是人类心智区别于其它物种心智的最本质特征,也是人脑智能的最本质特征
问题:既然人脑能够从文本获取和学习知识,机器脑也应该具备从文本中抽取知识的能力,但机器并不能直接读取文本字符串
知识图谱旨在利用图结构建模、识别和推断事物之间的复杂关联关系和沉淀领域知识,是实现认知智能的重要基石
知识图谱是结构化的语言
二、知识图谱的起源![](https://img-blog.csdnimg.cn/direct/df93b2d6743d4b31be20ff279743b555.png)
三、知识图谱的价值
KG辅助搜索—语义搜索(百度)
KG辅助问答交互—知识问答(天猫精灵)
KG辅助推荐系统—增强User和Item的特征表示
KG辅助大数据分析、KG辅助视觉理解、语义辅助设备互联
四、知识图谱的技术内涵
知识图谱是典型的交叉技术领域,与机器学习交叉产生了知识图谱嵌入、知识图谱表示学习等交叉领域。
1、基于图的知识表示
最常用的知识图谱表示方法有属性图和RDF图两种,而这两种都基于共同的图模型—有向标记图。
KG就是基于有向标记图的知识表示方法
2、图数据存储与查询
图数据库充分利用图的结构建立微索引,这种微索引比起关系数据库的全局索引在处理图遍
历查询时更加廉价,其查询复杂度与数据集整体大小无关,仅正比于相邻子图的大小。
图数据库并非知识图谱存储的必选方案。
3、知识的抽取
知识图谱的构建依赖于已有的结构化数据,通过映射到预先构建的 来冷启动,然后利用自动化抽取技术,从半结构化和文本中提取结构化信息来补全知识图谱。
同时,完全自动化的抽取高质量的知识是无法做到的,机器抽取+人工是目前的主流路线
4、知识图谱融合
在构建过程中使用知识图谱融合将多个来源的数据中的实体、概念映射到统一的命名空间中。
基于表示学习的方法是当前实现知识图谱异构融合的主流技术。
5、知识图谱推理
推理的目标是利用KG中已经存在的关联关系或事实来推断未知的关系或事实