知识图谱中的关系方向与强度研究
臧根林1,2, 王亚强1,2, 吴庆蓉1,2, 占春丽1,2, 谢新扬1,2
1 拓尔思知识图谱研究院,广东 广州 510665
2 广州拓尔思大数据有限公司,广东 广州 510665
摘要:目前普遍的知识图谱构建思路是图谱中的关系标签采用文字描述,这样很难对图谱中的关系进行计算。针对这个问题,提出了关系方向、强度因子和时态因子的概念,关系的正负、强度和时态可以通过有监督机器学习的方法形成自动模型,从而在领域知识图谱中实现关系的量化计算。这种知识图谱构建方法在计算事件舆情走向、计算企业合作与竞争情况变化、分析销售人员市场拓展情况等领域,形成了一种新的数据分析模式,对人工智能在具体行业的落地应用很有意义。
关键词:知识图谱 ; 关系方向 ; 关系强度 ; 负关系 ; 时态关系
论文引用格式:
臧根林,王亚强,吴庆蓉,占春丽,谢新扬. 知识图谱中的关系方向与强度研究. 大数据[J], 2019, 5(3):96-103
ZANG G L, WANG Y Q, WU Q R, ZHAN C L, XIE X Y.Study on direction and strength of relation based on knowledge graph. Big Data Research[J], 2019, 5(3): 96-103
1 引言
知识图谱本质上是一个用图数据结构等技术作为载体,描述客观事物及其关系的大型知识库。在具体实现上,知识图谱用语义网(semantic web)中的资源描述框架(resource description framework,RDF)对知识体系和实例数据两个层面的内容进行统一表示,共同构成一个完整的知识系统。
世界本身不存在结构化问题或非结构化问题,在信息化时代之前也没有人区分结构化或非结构化,但人类进入信息化时代后,什么都想通过计算得到结果,这就产生了信息是否要结构化的问题,因此这是人类为了将就计算机而产生的问题。知识图谱把这个问题进一步加深了,因为大家不仅想让计算机计算信息,还想让计算机学会跟人类一样思考和判断,也就是现在很热门的人工智能。为了教会计算机看懂人类的知识,人们将知识整理成了知识图谱。
虽然知识图谱的概念由谷歌公司在2012年5月首次提出,但知识图谱这样的理念和表达思路在中国已经存在了超过2000年,五行理论和相生相克图就是一个典型的知识图谱结构。知识图谱描述的3个关键要素是实体、属性和实体之间的关系,五行相生相克图(如图1所示)完整表达了这3个要素,金、木、水、火、土每个字不但表达一种实体类型,而且字面本身已经蕴含了属性解释,如“水”字是指世界上一切液体性质的实体,每