知识图谱初探

多次听到知识图谱的概念,据说被称为“下一代搜索技术”,一直很好奇。趁着考试暂时告一段落,简单了解了一下知识图谱的相关知识,只希望自己能有个大概认识,不追求特别深入的学习。

(一)知识图谱初探

百度百科对知识图谱的定义如下:“知识图谱,也称为科学知识图谱,它通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论,为学科研究提供切实的、有价值的参考。”

感觉这个定义虽然全面却很冗长,让人很难把握知识图谱的核心,我们可以参考更通俗理解——我们可以把知识图谱理解成一张由知识点相互连接而成的语义网络。(简单来说,知识图谱的重点元素包括节点和关系 or 实体和实体属性 )


参考上图,知识图谱由节点和节点关系构成,其中人物、作品、地点等实体可以作为节点,而每个实体可能包含若干个属性,比如人物这个实体就具有生日、妻子、身高等属性。我们可以通过实体的属性将不同的实体建立关联关系,如

刘德华 (实体)-- 妻子(属性) -> 朱丽倩(另一个实体)

刘德华(实体) -- 电影作品(属性)-> 无间道(另一个实体)

无间道(实体)-- 制片国家/地区(属性) -> 中国香港(另一个实体)

(二)从万维网到知识图谱
随着信息爆炸式的增长,人们希望搜索引擎可以给出更精确的回答,在这种背景下,如果搜索引擎只是将网页文档存储下来,然后按照传统方式进行信息检索,很难做到精准地满足用户需求。可以考虑借助知识图谱技术,想办法识别出网页中出现的实体以及实体属性,并将它们纳入到知识图谱中,当用户发起搜索时,根据知识图谱已知的知识点,准确理解用户意图,并给出最精准的回答。下图展示了从万维网到知识图谱的转换过程(示意图)。


(三)知识图谱的表示和本质

知识图谱旨在描述真实世界中存在的各种实体或概念。其中,每个实体或概念用一个全局唯一确定的ID来标识,称为它们的标识符(identifier)。每个属性-值对(attribute-valuepair,又称AVP)用来刻画实体的内在特性,而关系(relation)用来连接两个实体,刻画它们之间的关联。知识图谱亦可被看作是一张巨大的图,图中的节点表示实体或概念,而图中的边则由属性或关系构成。知识图谱率先由Google提出,以提高其搜索的质量。

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。

(四)知识图谱的作用

为了让用户能够更快更简单的发现新的信息和知识,搜索引擎可以借助“知识图谱”来将搜索结果进行知识系统化,用户搜索任何一个关键词都能获得完整的知识体系。不管用户搜索的关键词是代表了地标、名人、城市、球队名、电影、专业词语还是一种菜的做法,“知识图谱”都可以将搜索结果的知识体系完整的呈现出来。

 

参考文献:

(1)百度百科

(2)什么是知识图谱? http://www.jianshu.com/p/ae871569af02

(3)知识图谱扫盲  https://sanwen8.cn/p/3f6TSuj.html


阅读更多
文章标签: 知识图谱
个人分类: 知识点总结
上一篇使用阻塞队列实现生产者-消费者模式——Java实现
下一篇Python 实现汉诺塔算法
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭