自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(125)
  • 收藏
  • 关注

原创 ICDE2023 | VEND:基于点编码的边存在性判定

这篇文章提出了一个在图数据领域至关重要的全新问题——通过给定的两个顶点去索引两点相连的对应边,这一边查询的基础操作在图数据库系统中随处可见,那么采用相应的策略去加速边查询操作将大幅度提升图数据库系统的查询效率以及吞吐量。

2022-11-04 16:28:35 367

原创 #gStore-weekly | SPARQL 执行过程中高级查询函数的求值(下)

本篇介绍了 SPARQL 执行过程中实际进行高级查询函数求值的 PathQueryHandler 类,的基本功能,其中重要的成员变量 csr ,及以 PathQueryHandler::shortestPath 为例的、与高级查询函数一一对应的成员函数,建议在阅读的同时结合源码 Database/CSR.h 、 Query/PathQueryHandler.[h|cpp] ,会更容易理解。接下来我们拟分析 SPARQL 执行过程中自定义算子函数的处理机制。

2022-11-04 16:26:33 285

原创 #gStore-weekly | SPARQL 执行过程中高级查询函数的求值(上)

本篇介绍了 gStore 中高级查询函数的基础语法和语义,及 GeneralEvaluation::getFinalResult 函数中驱动高级查询函数求值的代码逻辑。

2022-10-19 16:03:20 157

原创 #gStore-weekly | gStore最新版本1.0之closenessCentrality函数的使用

closenessCentrality函数的使用

2022-10-18 11:03:09 159

原创 #gStore-weekly | gStore最新版本1.0之宽度优先遍历函数的使用

宽度优先遍历函数的使用

2022-10-18 11:02:17 151

原创 #gStore-weekly | gStore最新版本1.0之三角形计数函数的使用

三角形计数函数

2022-10-18 11:00:54 197

原创 #gStore-weekly | SPARQL执行过程中的表达式求值(上 下)

SPARQL 查询中,有三种语法结构中可能出现表达式:1. SELECT 语句中:例如,若我们希望知道一位名叫张三的学生其语文、数学、英语三科的总成绩,则可以发起以下 SPARQL 查询:SELECT ((?score1 +?score2 +?{?student "张三" .?student ?score1 .?student ?score2 .?student ?score3 .}在这个查询中,SELECT 语句中的表达式(?

2022-10-18 10:59:58 104

原创 论文导读 | 无锁并发哈希表

本文介绍了无锁并发哈希表的分类、常用方法、经典结构和2个新文章。无锁结构比起有锁结构,提供了更好的进度保证,且不容易阻塞,提高了加速比。但在实现中,无锁需要考虑的问题很多,比如怎么做空间回收,怎么避免或处理重复key的KV的情况等。有锁的方案设计起来相对简单,在冲突不多时也是一个很好的选择。

2022-10-18 10:56:09 233

原创 ICDE 2023 | GAMMA:一个在大图上进行图挖掘算法的GPU上的处理框架

PKUMOD胡琳博士关于图模式挖掘的论文《GAMMA:A Graph Pattern Mining Framework for Large Graphs on GPU》被ICDE 2023 接收。

2022-10-18 10:53:40 628

原创 图数据库 gStore 1.0 版本正式发布

2022年10月1日,面向大规模知识图谱应用的原生图数据库系统gStore 最新的1.0版本正式上线发布。

2022-10-04 16:14:11 735

原创 #gStore-weekly | SPARQL 解析(上)

简介

2022-09-09 14:50:08 83

原创 #gStore-weekly | SPARQL 解析(下)

在本篇中,我们将以一个简单的 SPARQL 查询为例,介绍 QueryParser 类在遍历语法解析树的过程中调用的关键函数。

2022-09-09 14:49:03 65

原创 #gStore-weekly | gStore最新版本1.0之自定义图分析算子

在内核版本v1.0中,开放了自定义图分析算子接口,可以通过接口函数获取图数据的结点数、边数、任意给定结点的邻居等,以此为基本单元进行实现;接下来将逐一进行介绍。

2022-08-25 09:54:00 49

原创 #gStore-weekly | RDF解析

RDF解析

2022-08-25 09:51:01 77

原创 #gStore-weekly | gStore最新版本0.9.1之BIND函数的使用

BIND

2022-08-16 10:54:03 19

原创 #gStore-weekly | gStore应用之交通气象风险评估与预警平台

gStore及生态产品由于完善的功能和卓越的性能已应用于金融、医疗、政府大数据、公安、纪检、工业互联网、军工、智能问答等多个领域,在多个互联网和人工智能公司的图数据和知识图谱项目进行了部署,已产生了良好的社会和经济效益。今天我们介绍gStore在智慧交通方面的应用:...

2022-08-16 10:52:43 81

原创 讲座录播|Wook-Shin Han教授:Combining Sampling and Synopses with Worst-Case Optimal Runtime and Quality Gua

2022年6月23日,POSTECH的Wook-Shin Han教授应北京大学王选计算机研究所数据管理实验室及北京大学人工智能研究院的邀请作讲座:Combining Sampling and Synopses with Worst-Case Optimal Runtime and Quality Guarantees for Graph Pattern Cardinality Estimation...

2022-08-16 10:51:40 201

原创 论文导读 | 并发数据结构与并发控制

随着处理器单核性能的提升越来越困难,人们更多的通过多核并发的方式来提升性能。而并发会带来很多的问题,如数据冲突,负载均衡等等。本文分享了两边关于并发处理的相关研究,希望对大家有所帮助。...

2022-08-16 10:50:19 89

原创 #gStore-weekly | 自建房监管知识图谱

通过新型技术手段来有效识别自建房风险点

2022-08-16 10:47:25 124

原创 #gStore-weekly | gstore源码解析(五):安全机制之日志追踪

对安全机制中日志追踪的源码进行解析。

2022-07-12 11:26:49 43

原创 论文导读 | 分布式图模拟

图模拟是一类宽松的图匹配模型。区别于子图同构要求匹配结果和匹配图具有相同的拓扑结构的规则,图模拟只对匹配节点的自身和一跳邻居有要求。得益于图模拟宽松的匹配规则,它具有较低的复杂度和更好的拓展性。这些优点引起了图算法界的注意,近些年,一些基于图模拟的研究工作陆续发表。...

2022-07-12 11:23:02 97

原创 论文导读 | Transformer架构下面向长文本的语言模型

自BERT出现之后,基于Transformer[1]架构的语言模型在各项NLP任务上取得了统治性的表现。原始的Transformer架构可以分为编码器和解码器两端,如图所示。在底层输入中,作者使用了位置编码(positional embedding)以注入序列的顺序信息;在每层单元中,都使用了多头注意力机制、残差连接和层归一化的组成单元。在解码时,解码器的注意力头可以同时看见解码端之前的输出和编码器的隐层表示以计算注意力权重。...

2022-07-12 11:21:10 211

原创 ICDE 2023|TKDE Poster Session(CFP)

The IEEE International Conference on Data Engineering (ICDE) and the IEEE Transactions on Knowledge and Data Engineering (TKDE) partner the TKDE poster track in ICDE 2023.

2022-06-27 11:02:58 342

原创 论文导读 | 关于将预训练语言模型作为知识库的分析与批评

今天我们便介绍关于PLM进行知识解码之机制与行为的一些分析性研究,它们展示了各类因素对PLM的知识预测结果的影响,进而构成了对当前设定下PLM替代KB作为知识源的质疑。

2022-06-27 11:01:52 242

原创 论文导读 | 机器学习在数据库基数估计中的应用

基数估计的问题定义和意义

2022-06-27 10:59:30 577

原创 #gStore-weekly | gStore源码解析(四):安全机制之黑白名单配置解析

对安全机制中黑白名单配置的源码进行解析

2022-06-27 10:56:52 225

原创 gBuilder内测活动圆满收官

gBuilder是北京大学王选计算机研究所数据管理实验室历经三年研发的知识图谱自动化构建平台。是通过结合NLP技术、机器学习、人工智能、知识图谱、图数据库等众多技术,打造的一个针对结构化数据和非结构化数据的知识图谱自动化构建平台,实现数据向知识的转化。...

2022-06-10 10:33:21 215

原创 #gStore-weekly | gStore防踩坑手册(上)

大家在使用gStore过程中是否踩过很多坑,流过很多泪。本期开发小哥用自己亲身经历来说明哪些地方有坑以及如何避免,以便其他使用者能够顺利使用gStore,达到前方尽是坦途。

2022-06-10 10:21:55 332

原创 #gStore-weekly | gStore源码解析(三):安全机制之用户权限管理解析

本章节介绍了安全机制的用户权限模块,分析了如何定义用户权限类别、如何管理用户的权限以及如何校验用户的权限,建议在阅读的同时结合源码Main/ghttp.cpp一起分析,会更容易理解。下一章将解析gStore安全机制中的黑白名单配置源码。...

2022-06-10 10:20:37 44

原创 论文导读 | 事件抽取技术发展现状

事件抽取技术发展现状梳理

2022-06-10 10:15:38 1074

原创 #gStore-weekly | gStore应用之应急指挥知识图谱服务平台

gStore及生态产品由于完善的功能和卓越的性能已应用于金融、医疗、政府大数据、公安、纪检、应急指挥、军工、智能问答等多个领域,在多个互联网和人工智能公司的图数据和知识图谱项目进行了部署,已产生了良好的社会和经济效益。今天我们介绍gStore在应急指挥方面的应用:...

2022-06-10 10:12:14 241

原创 gstore源码解析(二):SOCKET网络服务源码解析

gstore源码解析(二):SOCKET网络服务源码解析​ 上一章我们介绍了基于boost实现的gstore http网络服务,本章将介绍基于TCP协议的socket网络服务。1.1 简介​ gserver模块实现了一个基于TCP协议的socket网络服务,支持socket API双向通信。本章将从服务参数解析、运行机制、请求解析三个方面来展开。1.2 服务参数解析​ gserver提供了丰富的操作参数,可以通过不同参数来进行一系列的操作,如启动、停止、重启服务、配置端口、查看端口等。实现

2022-05-24 15:44:38 63

原创 图数据库入门系列 | 图流研究入门-北京大学苟向阳博士

北京大学数据管理实验室哔哩哔哩账号“图谱学苑”新系列视频:“图数据库入门”系列开始更新啦!“图数据库入门”系列将通过十分钟视频,为大家介绍图数据库不同研究方向的相关的基础知识、经典论文等内容,方便大家快速了解和入门。“图数据库入门”系列的主讲是北京大学数据管理实验室的老师和高年级博士赶紧来看看第一讲图流研究入门欢迎大家持续关注~内容介绍图流是近年来的一个热门研究领域,它同时具有图的结构复杂性和数据流的动态性,具有较大的挑战性和开阔的研究前景。本次...

2022-05-24 15:42:44 128

原创 论文导读 | 基于查询图生成的复杂知识图谱问答

复杂问题往往具有在知识图谱上的多跳,聚合,比较,判断等多种特点中的一个甚至多个。对于这些自然语言问题,基于知识库的复杂问答系统可以给出传统的搜索引擎等方式无法给出的答案。该方面研究可以被划分为三大类:基于模板的方法、基于语义解析的方法以及端到端的方法。本文将着重介绍基于语义解析的方法。该类方法旨在将自然语言问题解析为逻辑形式查询,需要进行管道建设(包括词汇映射、逻辑语言构建、图谱查询等步骤),具有覆盖率高、准确率高的优点,但效果也会受到复杂管道的误差累积限制,面临的主要挑战有语言模糊性、搜索空间大、组合

2022-05-24 15:41:11 284

原创 #gStore-weekly | gStore最新版本0.9.1之gServer详解(下)

在内核版本v0.9.1中,新增了gServer组件,实现Socket API双向通信;上一讲介绍了gServer组件的命名参数和接口交互以及简单的接口信息。接下来将介绍gServer组件的每个接口的使用和详情。1 login登录简要描述•登陆用户(验证用户名和密码)参数 参数名 必选 类型 说明 op 是 string 操作名称..

2022-05-24 15:40:21 84

原创 #gStore-weekly | gStore最新版本0.9.1之gServer详解(上)

在内核版本v 0.9.1中,新增了gServer组件,实现Socket API双向通信;我们除了通过ghttp组件远程访问gStore之外,现在还可以通过gServer组件来实现远程访问。接下来将详细介绍gServer组件的命令参数以及各接口的使用。1、参数介绍我们可以通过bin/gserver -h查看gServer组件参数信息:$ bin/gserver -hgStore Server (gServer)Usage: bin/gserver [option]Options:-h,-.

2022-05-24 15:37:47 90

原创 北京大学王选计算所数据管理研究室招聘启事

北京大学王选计算机研究所数据管理研究室长期招聘数据库和数据挖掘研究方向: 助理教授(Tenure-trackAssistant Professor) 助理研究员(北大研究系列岗Research Assistant Professor) 博士后 研究专业/方向包括但不限定于以下方向:1)数据库方向,尤其是图数据库算法、图数据库系统等。2)图计算方向,包括图分析、图数据挖掘、图机器学习,以及基于硬件(GPU、FGPA等)的图算法和加速...

2022-05-24 15:36:26 176

原创 讲座录播|Kurt Stockinger教授:使用机器构建智能信息系统

Kurt Stockinger教授应北京大学王选计算机研究所数据管理实验室及北京大学人工智能学院邀请,于2022年5月13日通过在线讲座方式为大家进行使用机器构建智能信息系统的公开讲座。讲座采用线上ZOOM会议室及Bilibili直播的方式,吸引了数百人观看和互动。讲座内容:1. 概述了大数据分析面临的困难与挑战2. 介绍在构建智能数据分析系统中的实践经验3. 介绍了Kurt Stockinger教授牵头构建的面向三种不同场景的智能信息系统:LILLIE、Bio-SODA和ValueNe

2022-05-24 15:35:00 43

原创 论文导读 | 关系型数据库中rank join查询计划的代价估计

本次主要介绍Adaptive rank-aware query optimization in relational databases论文中对rank join算子进行代价估计的部分。Ilyas I F, Aref W G, Elmagarmid A K, et al. Adaptive rank-aware query optimization in relational databases[J]. ACM Transactions on Database Systems (TODS), 2006,

2022-05-24 15:32:34 68

原创 论文导读 | 使用路径索引加速正则路径查询的执行

引言正则路径查询(Regular Path Query, RPQ)是图数据上的一类重要的查询,可用于寻找图数据中具有某些复杂关系的结点对。本文将会对旨在优化这一查询执行的过往工作做大致的梳理,并重点介绍其中使用路径索引(Path Index)进行加速的一类工作。问题定义给定一张边上带标签的有向图、一个正则表达式,正则路径查询返回图中以满足该正则表达式的路径相连接的源-目标结点对集合,其中“满足”定义为路径所含的边按序组成的标签序列(即字符串)在该正则表达式定义的正则语言中。正则路径查询有重要

2022-05-24 15:30:52 188

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除