在neo4j中如何将并行一度关系查询性能提升

最新推荐文章于 2024-04-14 21:23:23 发布

yayun_kg

最新推荐文章于 2024-04-14 21:23:23 发布

阅读量862

点赞数 1

分类专栏： neo4j 知识图谱知识图谱图计算文章标签：知识图谱

本文链接：https://blog.csdn.net/for_yayun/article/details/120758540

版权

neo4j 同时被 3 个专栏收录

31 篇文章 12 订阅

订阅专栏

知识图谱

13 篇文章 2 订阅

订阅专栏

知识图谱图计算

5 篇文章 2 订阅

订阅专栏

在海量的neo4j的图数据库中，如何进行并行一度关系查询性能提升。可以通过巧妙的使用Cypher并搭配存储过程，可以实现很多实用的查询。

一、查询需求

[A=[A1,A2,A3,…,An]，B=[B1,B2,B3,…,Bm]，A和B是两个节点集合。需要查询A中的每个元素分别和B中每个元素是否有一度关系，并返回有关系的实体对。

这个查询实现了寻找A中的每个元素分别和B中每个元素是否有一度关系的需求，实现了基本的功能。查询执行时是顺序执行，无法并行。
在查询的上半段定义了集合a和b，使用笛卡儿积的方式组合两个列表的元素传入下半段查询，即apoc.cypher.run的部分。在apoc.cypher.run中实现了判断两节点是否有一度关系的查询，当没有关系时查询不会下推执行。在RETURN部分返回关系的开始与结束节点。
编写一个基础查询

WITH 
  ['Lilly Wachowski','Carrie-Anne Moss','Laurence Fishburne'] AS a,
  ['Taylor Hackford','Al Pacino','Charlize Theron'] AS b
UNWIND a AS ale
UNWIND b AS ble
WITH ale,ble
CALL apoc.cypher.run(
  'MATCH (a:Person)-[r]-(b:Person) WHERE a.name={ale} AND b.name={ble} RETURN r LIMIT 1',
  {ale:ale,ble:ble}
  ) 
  YIELD value 
WITH value.r AS r
RETURN STARTNODE(r) AS sNode,ENDNODE(r) AS eNode

二，使用并行优化查询

在二查询的基础上，使用apoc.cypher.parallel2并行方式优化，同理多度关系的并行也可以使用这种方式实现。默认情况下，最大并行数为CPU内核数 x 100。例如，如果数据库被分配了4个内核，那么并行的最多进程数为400。通过该语句批量查询时性能至少会有50%以上的提升。

CALL apoc.cypher.parallel2(
'WITH $a AS a,$b AS b 
 UNWIND a AS ale 
 UNWIND b AS ble WITH ale,ble 
 CALL apoc.cypher.run(
         \'MATCH (a:Person)-[r]-()-[*..3]-(b:Person) WHERE a.name={ale} AND b.name={ble} RETURN r LIMIT 1\',
         {ale:ale,ble:ble}
     ) 
     YIELD value 
     WITH value.r AS r 
     RETURN STARTNODE(r) AS sNode,ENDNODE(r) AS eNode
     ',
{a:['Lilly Wachowski','Carrie-Anne Moss','Laurence Fishburne'],b:['Taylor Hackford','Al Pacino','Charlize Theron']},
'a'
)

参考链接：
http://neo4j.com.cn/topic/61663f0703dea95514def0aa

yayun_kg

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
在neo4j中如何将并行一度关系查询性能提升

在海量的neo4j的图数据库中，如何进行并行一度关系查询性能提升。可以通过巧妙的使用Cypher并搭配存储过程，可以实现很多实用的查询。一、查询需求[A=[A1,A2,A3,…,An]，B=[B1,B2,B3,…,Bm]，A和B是两个节点集合。需要查询A中的每个元素分别和B中每个元素是否有一度关系，并返回有关系的实体对。这个查询实现了寻找A中的每个元素分别和B中每个元素是否有一度关系的需求，实现了基本的功能。查询执行时是顺序执行，无法并行。在查询的上半段定义了集合a和b，使用笛卡儿积的方式组合两个列
复制链接

扫一扫