SparkGraphX和Neo4j对比

SparkGraphX和Neo4j对比

Neo4j

优点

  1. 支持交互式查询,查询效率很高。能够迅速从整网中找出符合特定模式的子网,供随后分析之用,适用于OLTP(Online Transaction Processing)场景
  2. 支持算法:
    1. 社区发现算法,
    2. 中心算法,
    3. 路径查找算法,
    4. 相似度算法,
    5. 连接分量预测算法

缺点

  1. 不支持数据分片。因此存储数据有限

Spark

  1. 支持海量数据,运算基于RDD,因此Spark的优点既是SparkGraphX的优点,他的概念集中在图计算,而非图存储和查询领域,适合OLAP(Online Analytical Processing)场景
  2. 支持算法
    1. 网页排名算法
    2. 三角计数算法
    3. 连接分量算法
    4. 社区发现算法
    5. 最短路径算法

Neo4j补充

Neo4j 是图数据库产品,偏向于存储和查询。图存储是说它能装那些关联关系比较复杂,实体之间的连接很丰富,就像一张网或一张图的数据。比如社交网络,知识图谱,金融风控等领域的数据。图查询是说它擅长从某个点或某些点出发,根据特定条件在复杂的关联关系中找到目标点或边。比如说在社交网络中找到我三步以内能认识的人,这些人可以认为是我的潜在朋友。这种数据量限定在一定范围内,能短时完成的查询就是所谓的 OLTP 操作。

GraphX补充

GraphX 是一个 Spark 的一个子模块,它是一个图计算系统,也可以说是图分析系统,它不去承担数据存储的职责。图分析和图查询的区别在于:图分析往往是整张图的操作,而且可能是多次迭代;而图查询只涉及图的一部分,且只需一次。对用户而言最直观的感受是:图分析很慢,图查询很快。

总结

Neo4j 这样的图数据库是在线事务处理 OLTP,GraphX 这样的图处理系统是在线分析处理 OLAP。

主要参考地址

https://www.zhihu.com/question/23916994

https://zhidao.baidu.com/question/1177784139537807219.html

https://neo4j.com/docs/graph-algorithms/3.5/

https://spark.apache.org/docs/2.2.0/graphx-programming-guide.html#aggregate-messages-aggregatemessages

https://stackoverflow.com/questions/28609125/neo4j-or-graphx-giraph-what-to-choose

https://www.jianshu.com/p/ad5cedc30ba4

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

天心有情

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值