知识图谱入门学习之路(一)
从学术的角度来定义“知识图谱本质上是语义网络的知识库”,从实际应用的角度出发其实可以简单的把知识图谱理解为多关系图,与传统的语义网络的差别主要体现在规模上。知识图谱主要的目标是用来描述真实世界中的各种实体和概念,以及实体之间的关系,在知识图谱中实体用节点来进行表示,实体与实体之间的关系用边来表示。
现在进入了智能时代催生了一系列的智能应用,而这些只能应用有需要认知智能,那么机器的智能化分为三个阶段:计算智能、感知智能、认知智能。计算智能这块好理解可以理解为机器的算力与速度,那么我们普遍都知道机器的算力是远超人类的,在感知智能这一块也就是比如像催生的语音识别、人脸识别、图像识别等领域,机器的表现已经与人类持平或者赶超人类了,那么最重要也最高深的就是机器的认知智能。那么什么是机器的认知智能呢,我们只是人类之所以很优秀是因为具有独立思考的能力,那么如何让机器也能够体现这一种思考的能力呢,具体就表现在机器能够理解数据,理解语言,理解现实世界;机器给人类的输出那么就是机器能够解释数据,解释过程,解释现实世界的形成。所以通过这一点我们可以发现认知智能是需要依赖知识图谱的,而知识图谱也能够使能可解释人工智能。
知识图谱在给人工智能可解释性的时候主要体现在其的概念、属性、关系中。
知识图谱从应用来说可以分为通用知识图谱和行业知识图谱。通用知识图谱是面向通用领域的就好比人类所掌握的各方面的常识,是思考需要仰仗的基石。主要以百科知识为主,以知识的广度为优势,通用知识图谱的构建需要耗费很大的人力与物力。那么说完通用知识图谱后下面就是行业知识图谱了,行业知识图谱主要是面向某一特定的领域,比如金融领域、社交领域等,以知识的深度为优势。在知识图谱实际的设计方案中工业上一般采用图数据库来进行存储知识图谱,常用的有Neo4j,janusGraph等,在实际选型中需要考虑图数据库的遍历效率,图算法的封装性,集群高可用,是否可以分布式等很多条件综合去考虑。
知识图谱的核心和困难点就在于如何去得到知识,定义知识。要搭建行业知识图谱需要做的就是要详细与业务进行结合去构建。
知识图谱中涉及到的关键技术包括:
- 数据获取
- 知识抽取
- 知识表示
- 知识融合
- 知识推理
关于知识图谱的详细构建在下一节来进行记录。