gBuilder知识图谱自动化构建平台招募首批内测用户

 gBuilder:知识图谱自动化构建平台 视频

gBuilder知识图谱构建平台功能演示 北京大学_哔哩哔哩_bilibili-https://www.bilibili.com/video/BV12q4y1P75A/

 

内测用户申请

申请条件

1 有使用数据库的经验及使用图数据库的经验;

2 使用过gStore单机版者优先;

3 及时反馈测试意见/在3个月测试结束后,填写测评调查问卷。

如何申请

有意者请点击问卷:gBuilder招募内测用户https://www.wjx.top/vj/QjzzA5E.aspx

扫描下方二维码填写调查问卷,我们将从中选取30名内测用户。

图片

我们针对有实际应用需求的内测用户,在试用期结束以后,根据用户具体需求,提供进一步的知识图谱自动化构建解决方案,敬请关注和垂询!

申请截止时间

2021年10月30日24点

联系方式

gstore@pku.edu.cn

    gBuilder是由北京大学王选计算机研究所数据管理研究室历经2年研发的知识图谱自动化构建平台.

    gbuilder基于机器学习,自然语言处理,图数据库等技术可以实现对结构化数据和非结构化数据的知识抽取,并转化为RDF三元组,从而实现与研究室研发的gStore图数据库系统无缝衔接,再加上研究室研发的面向知识图谱自然语言问答引擎gAnswer,形成了覆盖知识图谱构建、知识图谱存储管理和知识图谱应用的完整生命周期的知识图谱一体化解决方案。

gBuilder的相关功能演示如下:

1. 项目管理功能

    gbuilder平台以项目形式来管理每个知识图谱构建任务,在项目管理模块中,用户可以创建项目,项目分为结构化项目和非结构化项目,并可以实时了解各项目流程情况,并可以在项目管理面板上对项目进行各项操作,如导入、导出、删除、编辑等。

图片

2. 知识图谱Schema设计功能

    无论是结构化项目还是非结构化项目,均需首先设计知识图谱Schema。知识图谱Schema一方面可以描述知识图谱中的实体类型、实体属性和关系等信息,另一方面也是知识图谱查询和分析的重要参考,相当于关系型数据库的表结构。知识图谱Schema可视化设计是gbuilder的特色功能之一,与protege不同的,是gBuilder的Schema设计采用的是以图的方式来表述知识图谱schema,用户可以通过拖拽的方式可以在画布上设计类、类属性和关系。

图片

3.结构化项目映射

    设计完知识图谱Schema之后,需要根据项目类型分情况设计知识抽取流程,对于结构化项目而言,其知识抽取流程设计就是将结构化表及字段,与Schema中的实体类型、属性、关系等进行映射,并形成映射文件。映射总共分为四个步骤:

    第一步是连接数据源,获取数据源表结构信息,目前gBuilder支持MySQL、Oracle、SQL Server,PostgreSQL和达梦等常见的关系型数据库,并可以获取指定数据库中表和视图的结构信息。

    第二步是表与实体对象的映射,该步骤主要是将表与对应的实体对象进行绑定,并设置实体对象的URI列的取值字段,如人物类实体与人物表绑定,同时取人物表的ID字段作为人物类实体的URI。

    第三步是将表字段与实体属性和关系进行映射,该步骤可以通过拖拽的方式将表的字段与实体属性和关系进行映射,对于

实体关系,还需要指定该关系对象所对应的表字段,从而当执行抽取流程时将该值自动转化为对应的实体对象

    第四步是处理跨表数据。该步骤主要用于处理代码类型的数据,如人物性别字段取值来源于代码表,如果不进行跨表处理,则抽取的RDF数据中性别将显示为代码,通过跨表关联,可以将性别转变为代码表中的标题字段,从而得到可理解的正确值。

图片

4.非结构化项目抽取流程设计

构建步骤如下:

    加载数据集,将需要用于构建图谱的非结构化数据按照每行一个样本的形式存储,在数据管理模块将这个数据集导入系统中

    设计构建流程。根据需要构建的图谱特点与数据的类型,从左边的模型与算子列表中拖拽合适的节点至构建画布中。

    在流程构建过程中,可以随时使用系统自带的流程检查功能和测试功能来测试流程的正确性与构造效果。

    完成构建后,可以查看构建的结果,可以看到前面设计的构造流程顺利从数据集中抽取出了构建知识图谱所需要的人物关系三元组。这些输出可以直接导出为 nt 文件,或存入图数据库中。

    此外,我们提供了大量的可选模型,它们有着不同的特性,以及在不同的数据上预训练,用户可以根据需求,挑选出最合适的模型作为构建模型,也可以使用自己的数据训练模型进行图谱构建。

图片

5.任务管理和导出下载

    结构化项目和非结构化项目流程设计完成之后,则需要进入任务执行过程,由于知识抽取是一个耗时操作,因此需要在后台执行,任务管理功能可以实时查看任务执行状态,并手动或定时执行任务。

    任务执行完毕后,将自动生成RDF三元组数据文件,用户可以通过下载功能下载RDF数据文件。

图片

gStore新闻

gCloud(gStore云平台)全面开通免费使用后登陆已超过万次

主页的gStore介绍视频播放量也突破万次

你之前了解哪些平台?

又对哪个平台感兴趣呢?

请告诉我们

公众号发送“社区”加入gStore社区

图片

gStore生态

gStore

gStore是由北京大学王选所数据管理实验室(PKUMOD)研发的面向知识图谱的开源图数据库系统。不同于传统基于关系数据库的知识图谱数据管理方法,gStore原生基于图数据模型(Native Graph Model),维持了原始知识图谱的图结构,将面向RDF知识图谱数据的SPARQL查询,转换为面向RDF图的子图匹配查询,利用我们所提出的多种图结构索引和查询优化机制,达到了在百亿规模的图上的秒级查询响应时间;相关研究成果发表多篇数据库领域顶级会议/期刊论文,前期理论成果获得教育部自然科学二等奖(《大规模图结构数据管理》)。

图片

图片

诚邀您加入我们的gStore社区,我们将在群内解决使用问题,分享最新成果~

扫码加客服同学邀请入群或微信公众号图谱学苑发送“社区”邀请入群~

图片

图片

图片

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值