PersonGraphDataSet近十万的开放人物关系图谱项目

PersonGraphDataSet

PersonGraphDataSet, nearly 10 thousand person2person relationship facts that build from extraction method, which can be applied to person kg search and inference applications。 人物图谱数据集,近十万的人物关系图谱事实数据库,通过人物关系抽取算法抽取+人工整理得出,可用于人物关系搜索、查询、人物关系多跳问答,以及人物关系推理等场景提供基础数据。

项目地址:https://github.com/liuhuanyong/PersonRelationKnowledgeGraph

项目由来

关于为什么要开放这个项目,主要有以下几个方面的缘由:
1、阶段性总结。以刻画人物复杂关系为核心的网络关系网构建,居于十分重要的现实意义,两年前,带着个人兴趣,发布了一个未完成版的人物关系知识图谱项目(https://github.com/liuhuanyong/PersonRelationKnowledgeGraph),尝试采用基于知识库的数据回标,基于远程监督与bootstrapping方法的人物关系抽取,并以此完成基于知识图谱的知识问答等应用。但但由于工作时间为题,一直没能更新。今天,先对该工作的一个结果数据集开放出来,以对之前的项目做一个阶段性的总结。
2、数据集空缺。目前,面向中文领域的人物关系抽取数据集,还相对较少,代表性有ccks2019的开放数据集(https://arxiv.org/abs/1907.12801) ,该数据集公开了亲属关系、社交关系、师生关系三大类,现夫、潜伏、朋友、恋人等34小类的人物关系数据集。该数据集是面向评测使用的,其所涉及的人物关系类型有限,并且不提供现成可用的人物关系数据。
3、应用驱动。当前,面向知识图谱入门级别的知识图谱推理、知识图谱可视化、知识问答、图谱搜索等场景,还缺乏可用的数据集。目前关于人物关系方面的应用,目前看到的,主要是百科类的展示以及搜狗人物图谱(https://www.sogou.com/tupu/person.html) 为代表,虽说是娱乐导向,但目前还缺乏这样的练手的数据和项目。
4、应用支撑。基于开放出来的人物关系知识数据,大家可以在此基础上进行多种应用尝试,包括算法训练、知识图谱入门、培训等等,这十分有意义。

项目构成

本项目一共包括三个文件,分别记录人物关系元组信息以及关系类型信息:
1、big_rel_distribution.txt:大类关系及其分布文件。
2、person_rel_kg.data:人物关系图谱数据集文件。
3、small_rel_distribution.txt:小类关系及其分布文件

数据概况

本数据集,一共包括97,158条人物关系数据,涉及人物71,243个,大类关系102个,小类关系266条,大致的情况具体如下:

数据类型 数据规模 示例
  • 2
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
人物关系图谱是一种基于图数据库的数据可视化方式,可以用于展示人物之间的关系。而neo4j是一种流行的图数据库,可以用于存储和查询大规模的图数据。下面是一个简单的介绍和演示: 人物关系图谱通常由节点和边组成,其中节点表示人物,边表示人物之间的关系。在neo4j中,节点和边都可以有属性,这些属性可以用于描述节点和边的特征。例如,一个人物节点可以有姓名、性别、出生日期等属性,一个关系边可以有关系类型、开始时间、结束时间等属性。 要创建一个人物关系图谱,首先需要定义节点和边的标签和属性。例如,可以定义一个Person节点标签,包含name、gender、birthday等属性,定义一个Relation边标签,包含type、start_time、end_time等属性。然后,可以使用Cypher语言编写图库语句来创建节点和边,并将它们添加到neo4j数据库中。例如,下面是一个简单的Cypher语句,用于创建两个人物节点和一条关系边: ``` CREATE (p1:Person {name: 'Alice', gender: 'female', birthday: '1990-01-01'}) CREATE (p2:Person {name: 'Bob', gender: 'male', birthday: '1995-02-02'}) CREATE (p1)-[r:Relation {type: 'friend', start_time: '2020-01-01', end_time: '2021-01-01'}]->(p2) ``` 这个语句创建了两个Person节点,一个名为Alice,一个名为Bob,以及一条Relation边,表示Alice和Bob之间有一个朋友关系,开始于2020年1月1日,结束于2021年1月1日。 创建完节点和边之后,可以使用Cypher语句查询和修改图数据。例如,下面是一个简单的Cypher语句,用于查询所有的Person节点和Relation边: ``` MATCH (p:Person)-[r:Relation]->(q:Person) RETURN p, r, q ``` 这个语句查询了所有的Person节点和Relation边,并将它们返回。 最后,可以使用各种工具和库来可视化人物关系图谱。例如,可以使用Python的matplotlib库和py2neo库来绘制图形,也可以使用JavaScript的d3.js库和neovis.js库来创建交互式图形。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值