一、知识表示学习简介
表示学习又称表征学习( Representation learning) , 主要是利用机器学习技术自动获取每个实体或者关系的向量化表达, 旨在将描述对象表示为低维稠密向量( 即分布式向量) 。
分布式表示的对象均被表示成一个低维的稠密、实值向量, 利用对象在空间的相对距离, 反映它们之间的语义关系。两个对象离得越近, 说明关系越紧密, 两个对象离得越远, 说明它们之间没有太强的关系。
将表示学习应用于知识表示中称之为知识表示学习或知识图嵌入。
知识表示学习是将知识库中的实体和关系嵌入到连续的向量空间中, 以便简化操作, 同时保持知识图谱的结构。
从形式上知识表示学习主要可以分成两类:
- 一种是基于结构的表示学习方法, 主要是从三元组的结构出发学习知识图谱中实体和关系的表示;
- 一种是基于语义的表示学习方法, 通过考虑文本语义来学习实体和关系的表示;
从发展来看, 目前知识表示学习的研究进程主要可以分成两个阶段, 以 2013 年 Borders 等人受Mikolov 发现的词向量空间中存在的平移不变性这一有趣现象的启发, 从而提出的 TransE 模型为分割。