知识图谱是一个宏大的数据模型,可以构建庞大的“知识”网络,包含世间万物构成的“实体”以及它们之间的“关系”,图文并茂地展现知识方方面面地“属性”,让人们更便捷地获取信息、找到所求。为了让大家对知识图谱有更深入的认识,今天这篇文章将由东南大学计算机科学与工程学院王萌老师为我们讲解基于向量空间的知识图谱查询及结果解释。
以下为王萌老师的演讲实录
深度学习和知识图谱的结合,目前是整个AI最新、最热的一个方向,如百度也是将知识图谱作为AI的核心竞争力。它的主要内容包括五个方面,分别是知识图谱及SPARQL查询、查询空集问题、知识图谱表示学习、基于向量空间的近似查询和实际应用。
知识图谱及SPARQL查询
知识图谱是机器生成并为机器服务的,服务对象不是人类,需要追求机器可理解的东西。一个大规模的知识图谱本质上是通过实体相关联,以及实体的各种属性构成的网络。知识图谱的目的是将以前处于非结构化的数据,中间发现的非结构化的实体和他们之间的关联,强调的是net、实体、关系,以及描述这些实体和关系的类别,最终会把非结构化的文本变成网络。
图一:医疗领域知识图谱
以医疗知识图谱为例,知识图谱可以把药物、疾病、症状、基因、病毒各种信息关联起来,形成一个庞大的数据网络。病人有两种方式和知识图谱产生关联,服药或者治疗。可以想象虽然只吃了这个药,但其实背后和一个庞大的知识库相关联。因此在分析病人的一些药物推荐或者是病人症状的时候,就可以在上面进行搜索。
SPARQL查询是类似于关系数据库的SQL, W3C推荐,面向关联数据的标准结构化查询语言,主要基于图模式匹配来查询信息。
知识图谱的优势目前已经应用在医疗领域、在线搜索、电影娱乐等领域。
查询空集问题
Alexandra Meliou曾说过“输入查询,得到结果,是互联网时代用户获取信息系统中有关数据的重要方式。理解查询的异常结果,是人类获取知识的