Neo4j教程网盘下载

网盘下载地址:https://u18103887.ctfile.com/fs/18103887-311624004
1.1 为什么要有Neo4j

为什么要使用图形数据库呢?或者更具体地说,Neo4j是你的数据库的
正确选择吗?正如前面所提到的,对于人们试图使用逻辑的方法,并用类似
于图形的结构和概念对他们特殊问题的领域进行建模和描述那是很自然的,
尽管他们最终可能并不是以图型数据库存储数据。选择正确的数据库(或者
是在存储领域中已有的多种语言版本的数据库中选择多种数据库)存储数据
可以使应用程序的运行速度大大加快,正像如果选错了数据库就会使程序完
全崩溃一样。

对于这个问题可以使用一个例子来做出很好说明。取一个非常适合于用
图形数据库解决的问题,看看怎样应用Neo4j解决,并与使用另一个不同数
据库的存储做出对比。为了便于比较,我们将使用传统的关系数据库作为比
较对象,因为这是在一般情况下大多数人涉及的存储对比的选择。更重要的
是,这也是大多数人在目前,也可能以后仍然会在解决问题时选择的关系数
据库模型。

我们要探讨的例子是一个社交网络,一组可能相互之间是朋友的用户。
图1-1显示了该社交网络,用箭头连接的用户之间是朋友关系。

注意

要使语义正确,朋友的关系应该是双向的。在Neo4j中,双向性是使用
两个关系建立的,以每一个关系建立一个方向(在Neo4j中,每个关系必须
要明确定义一个方向,但以后会定义多个方向)。因此,你应该会看到每对
朋友之间都有两个独立的朋友关系,在每个方向上有一个关系。为简单起
见,我们建立了单向直接的朋友关系。在第2章和第3章中你将会了解为什么
这种数据模型在Neo4j中实际上是非常高效的。
让我们来看看关系数据库如何存储用户及他们的朋友。
1.2 关系数据库中的图形数据

在关系数据库中,通常使用两个具有关系的表格存储社交网络的数据:
一个用于存储用户信息,而另一个用于存储用户之间的关系(参见图1-2)。

图1-1 以图形数据结构描述的用户与他们的朋友
图1-2 描述用户及其朋友数据的SQL图表

程序1-1显示了在MySQL数据库中用SQL脚本语言创建的表。

【程序1-1】 SQL脚本语言定义的社交网络数据表

表t_user包含着用户信息的列,而表t_user_friend只有两列,用外键关系
引用表t_user。主键和外键具有索引,以便进行快速查找操作。索引是关系
数据库中使用的典型查找技术。

使用MySQL查询图形数据

你会如何去查询一个关系数据库呢?获取一个特定用户的直接朋友数是
相当简单的。如下的基本select查询就可以实现这一目的:

注意

我们在所有的例子中计算所有的朋友数量,因此,不能通过加载实际的
数据而使CPU或内存超载。

如何找到一个用户的朋友的所有朋友?通常,在查询前,典型的做法是
将表t_user_friend与它自身联接起来。

流行的社交网络通常具有从你的具有一定分离度或深度的朋友圈推荐潜
在的朋友或联系人的功能。如果你想做某一些相似的事情以寻找某一个用户
的朋友的朋友的朋友,你仅仅需要另外的一个join操作。

同样,要做一个四层关系的循环,就需要四个join操作。要获得著名的
六度分离问题的所有连接,将需要6个join操作。
对于这种做法,没有什么不正常的,但是有一个潜在的问题:尽管你只
关心单一用户的朋友的朋友,但你必须对表t_user_friend中的所有数据做一
个join操作,然后丢弃你不再感兴趣的所有行。对于一个小的数据集,这将
不会是一个大的问题。但是,如果这个社交网络不断发展壮大,你可能开始
遇到一些严重的性能问题。正如你将看到的,这将会给关系型数据引擎带来
巨大的压力。

为了说明这种查询的性能,在一个具有1000个用户的小数据集上运行几
次朋友的朋友查询,并在每次调用和记录每次的查询结果的同时,增加搜索
的深度。在一个具有1000用户的小数据集中,平均每一个用户具有50个朋
友。表t_user包含了1000条记录,而表t_user_friend包含了1000×50=50000条
记录。

在每个深度上运行了10次查询,这仅仅是在任何情况下都能帮助提高性
能的一个开始,记录下在每一深度上的最快运行时间。除在程序1-1中用
SQL脚本语言对数据库的列定义索引外,不对数据库进行其他的性能调整。
表1-1给出了实验的结果。

表1-1 使用MySQL数据库引擎对一个有1000个用户的数据库使用多个join查
询的运行时间

注意

所有的实验均在Intel i7-CPU、8GB内存的商用笔记本电脑上完成,本书
的写作也是在这台笔记本电脑上完成的。

注意

在深度为3、4、5时均返回数值999,这是由于数据集太小,数据库中的
每一个用户都相互关联着。

正如你能够看到的,MySQL处理查询的深度为2和3时,其表现相当不
错。关系数据库的join操作并非不常见,而是很通常的操作。因此很多数据
库引擎都把这种操作作为默认的设计。使用数据库相关列上的索引也能帮助
关系数据库最大化其执行join查询操作的性能。

然而,在深度为4和5时,性能显著下降:涉及深度4的查询需要10秒以
上才能完成,而在深度5时,尽管计数结果没有改变,但执行的时间就更长
了,超过了一分半钟。这说明了当处理图形数据时MySQL所受到的限制:
深度图形需要多个join操作时,关系数据库通常表现得不太好。

SQL的join操作的低效率性
要在深度5查找一个用户的所有朋友,关系数据库引擎需要产生
t_user_friend表的笛卡儿积五次。对于一个拥有50000个记录的表,所得到的
数据集将有500005行(102.4×1021),这需要相当长的时间和计算能力来做
出这些计算。最后只返回了你感兴趣的不到1000条的记录,而放弃了超过
99%的计算结果!

正如你所看到的,关系数据库并不擅长多对多关系的数据模型,尤其是
在大型数据集时。而相反,Neo4j正好擅长多对多的关系,因此,让我们来
看看Neo4j是如何使用相同的数据集来实现的。不是使用表、列和外键,而
是通过将用户作为节点、朋友关系作为节点之间的关系来建立模型的。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
neo4j api neo4j学习资料 neo4j教程neo4j官方API(官方各种API的文档整理).7z │ neo4j数据迁移--初探(一).htm │ neo4j笔记.docx │ neo4j错误码状态码.html │ └─01.neo4j学习博客汇总 │ index.html └─neo4j_cypher │ Cypher(神奇的WITH).html │ cypher_index.html │ Cypher查询语言--Neo4j 综合(四) - divenswu - 博客园.html │ Cypher查询语言--Neo4j中的SQL - 爱上包子 - 博客园.html │ DETACH DELETE n 删除node n ,并删除所有与n相关的关系.html │ Neo4j - NOT IN query.html │ Neo4j CQL - (11)- REMOVE删除 DELETE.html │ Neo4j Cypher 复杂查询详解在之With - 何源浩的博客 - CSDN博客.html │ neo4j 中使用sparql查询.html │ Neo4j 中文社区,致力于 Neo4j 的技术研究。.html │ Neo4j 使用cypher语言进行查询 - MHL - 博客园.html │ Neo4j 第一篇:在Windows环境中安装Neo4j - 悦光阴 - 博客园.html │ Neo4j 第三篇:Cypher查询入门 - 悦光阴 - 博客园.html │ Neo4j 第二篇:数据库 - 悦光阴 - 博客园.html │ Neo4j 第五篇:批量更新数据 - 悦光阴 - 博客园.html │ Neo4j 第四篇:使用C更新和查询Neo4j - 悦光阴 - 博客园.html │ Neo4J(Cypher语句)初识.html │ Neo4J(Cypher语句)学习 - 赵晓雷的专栏 - CSDN博客.html │ Neo4j_事务&深度遍历.html │ neo4j中的分组查询.html │ Neo4j之Cypher学习总结.html │ NEO4J亿级数据导入导出以及数据更新 - 耶和华靠近伤心的人,拯救灵性痛悔的人 - CS.html │ Neo4j入门点滴(一):Cypher.html │ Neo4j入门点滴(三):用Cypher完善.html │ Neo4j入门点滴(二):模式与模式匹配.html │ Neo4j入门点滴(五):Windows Shell for Cypher.html │ Neo4j入门点滴(四):Cypher查询优化.html │ Neo4J几种数据导入方式的效率对比 - 何源浩的博客 - CSDN博客.html │ Neo4j模糊查询及分页查询 - c1052981766的专栏 - CSDN博客.html │ neo4j笔记 - Neo4j 中文社区.html │ Neo4j语句 - zhuweiba_321的博客 - CSDN博客.html │ Neo4j语句 - 阿里云.html │ 【程裕强的专栏】大数据学习笔记(1.01^365=37.78,0.99^365=0.025.html │ 五岳之巅-Neo4j入门点滴-博文目录.html │ 关于Neo4j和Cypher批量更新和批量插入优化的5个建议 - 逆水行舟 - CSDN博.html │ 数据库-Neo4j介绍与Cypher入门.html │ 数据库之Cypher语言 - 活的洒脱怪我咯的专栏 - CSDN博客.html │ 数据库neo4j-jdbc的使用 - 活的洒脱怪我咯的专栏 - CSDN博客.html │ 数据分页处理系列之三:Neo4j数据分页处理.html │ 暖暖动听.html │ 飘涯 - 简书.html
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值