TinkerPop入门指南-Gremlin教程

TinkerPop 入门指南-Gremlin教程 点击这里免费看全文


Apache TinkerPop™是一个 开源的图计算框架。在TinkerPop内部,它代表着一系列丰富的功能和技术,在其更广泛的生态系统中,还有许多第三方贡献的图库和系统。对于各个经验水平的新手来说,TinkerPop的生态系统可能看起来很复杂,尤其是初次浏览参考文档时。

那么,如何开始使用TinkerPop?如何快速入门并提高工作效率?好吧……最具代表性的TinkerPop成员Gremlin会在这个30分钟的教程中为您提供帮助。没错:在短短的30分钟内,您也可以开始使用TinkerPop构建图应用程序。欢迎来到由Gremlin带领的TinkerPop锻炼!

Gremlin健身房

前五分钟

在与TinkerPop度过的五分钟里,您可以学到很多关于TinkerPop的知识,但在此之前,我们需要对您的教练进行适当的介绍。请认识一下Gremlin!

Gremlin帮助您遍历图的顶点和边缘。他本质上是您查询图数据库的查询语言,就像SQL是关系数据库的查询语言一样。要告诉Gremlin如何"遍历"图(也就是您想要查询做什么),您需要以他能理解的语言提供命令 - 当然,这种语言被称为"Gremlin"。为此,您需要TinkerPop最重要的工具之一:Gremlin控制台。

注意:您不确定顶点或边缘是什么吗?下一节将介绍这个主题,但请先让教程带您熟悉Gremlin控制台,这样您就可以了解到这个将帮助您学习的工具。
下载控制台,解压缩并启动它:

$ unzip apache-tinkerpop-gremlin-console-3.7.1-bin.zip
$ cd apache-tinkerpop-gremlin-console-3.7.1
$ bin/gremlin.sh

提示:Windows用户可以使用附带的bin/gremlin.bat(Java 8的bin/gremlin-java8.bat)文件启动Gremlin控制台。
Gremlin控制台是一个REPL环境,可以在您输入的代码上获得即时反馈,这种方式使您在尝试时无需"创建项目"来尝试事物更加简单。然而,控制台不仅适用于"入门"。您会发现自己在各种与TinkerPop相关的活动中使用它,例如加载数据、管理图形和处理复杂的遍历。

要让Gremlin遍历图,您需要一个TraversalSource实例,它持有对Graph实例的引用,而Graph实例则持有图的结构和数据。TinkerPop是一个图抽象层,可在不同的图数据库和不同的图处理器之上运行,因此有许多Graph实例可供选择,在控制台中实例化与之连接。然而,最好的Graph实例来开始,是TinkerGraph。TinkerGraph是一个快速的内存中图数据库,具有少量的配置选项,非常适合初学者。

提示:TinkerGraph不仅仅是初学者的玩具。它在从大型图中分析子图、使用几乎不变的小型静态图进行工作、编写单元测试以及其他可以将图装入内存的用例中非常有用。
提示:为了"入门"目的,不要诱惑自己去挖掘具有大量配置选项的更复杂的数据库,或者深入研究如何正确运行Gremlin Server。专注于本指南中介绍的基础知识,为TinkerPop提供了坚实的基础。
为了使学习过程更加简单,请从TinkerPop的"toy"图之一开始。这些是"小"图,旨在快速开始查询。熟悉它们是很好的,因为几乎所有TinkerPop文档都是基于它们的,当您需要帮助并必须来到邮件列表时,将失败的示例放在toy图的上下文中通常可以让您快速获得问题的答案。

提示:当在邮件列表或StackOverflow上提问有关Gremlin的问题时,提供一个样本图是很有帮助的,这样那些试图回答您问题的人就能够准确了解您拥有的图的类型,并能够集中精力提供好的、经过测试的答案,而不是试图自己构建示例数据。示例图应该只是一个简单的Gremlin脚本,可以复制并粘贴到Gremlin控制台会话中。
对于第一个图,使用"Modern"图,它看起来像这样:
在这里插入图片描述
可以通过以下方式在控制台中实例化它:

gremlin> graph = TinkerFactory.createModern()
==>tinkergraph[vertices:6 edges:6]
gremlin> g = traversal().withEmbedded(graph)
==>graphtraversalsource[tinkergraph[vertices:6 edges:6], standard]

第一条命令创建了一个名为graph的Graph实例,因此提供了一个引用,可以让Gremlin遍历您要查询的数据。不幸的是,仅仅拥有graph并不能为Gremlin提供足够的上下文来完成他的工作。您还需要一些被称为TraversalSource的东西,这是由第二个命令生成的。TraversalSource为Gremlin提供了额外的信息(例如要应用的遍历策略和要使用的遍历引擎),这些信息指导Gremlin在图中执行他的旅行。

创建TraversalSource有几种方法。上面的示例使用了嵌入式样式,并且是一种仅限于使用Java虚拟机(JVM)的语言的方法。其他方法在形式上类似,但不是本教程的重点。请参阅参考文档,了解有关与Gremlin连接的不同方式的更多信息。

注意:通过静态导入AnonymousTraversalSource类的traversal()方法,可以以更流畅的方式使用它。所有支持Gremlin的语言都有共同的导入,使其更容易阅读和编写(Java、Python、.NET、Javascript)。
现在,您可以让TraversalSource g遍历图了:

gremlin> g.V()  (1)
==>v[1]
==>v[2]
==>v[3]
==>v[4]
==>v[5]
==>v[6]
gremlin> g.V(1)  (2)
==>v[1]
gremlin> g.V(1).values('name')  (3)
==>marko
gremlin> g.V(1).outE('knows')  (4)
==>e[7][1-knows->2]
==>e[8][1-knows->4]
gremlin> g.V(1).outE('knows').inV().values('name')  (5)
==>vadas
==>josh
gremlin> g.V(1).out('knows').values('name')  (6)
==>vadas
==>josh
gremlin> g.V(1).out('knows').has('age', gt(30)).values('name')  (7)
==>josh
  1. 获取图中的所有顶点。
  2. 获取唯一标识符为"1"的顶点。
  3. 获取唯一标识符为"1"的顶点的"name"属性值。
  4. 获取唯一标识符为"1"的顶点的"label"为"knows"的边。
  5. 获取唯一标识符为"1"的顶点所"知道"的人的名称。
  6. 注意,当使用outE().inV()时,可以缩短为out()(类似于inE().outV()和in()用于传入的边)。
  7. 获取唯一标识符为"1"的顶点所"知道"的年龄超过30岁的人的名称。

提示:变量g(即TraversalSource)只需要实例化一次,然后应该重复使用。

**重要:**遍历(Traversal)本质上是一个迭代器,因此如果您有类似x = g.V()的代码,那么x并不包含g.V()查询的结果。相反,该语句将一个迭代器值分配给x。要获取结果,您需要迭代x。理解这一点很重要,因为在控制台中键入g.V()会立即返回一个值。控制台会为您完成一些魔法,它注意到g.V()返回一个迭代器,然后自动迭代结果。简而言之,在控制台外编写Gremlin时,请始终记住必须以某种方式手动迭代遍历(Traversal),才能使其发挥作用。有关"迭代遍历"的概念将在Gremlin控制台教程中进一步描述。

在与Gremlin度过的这五分钟里,您已经安装了Gremlin控制台,实例化了一个Graph和TraversalSource,编写了一些遍历,并且希望对TinkerPop有所了解。您只是初步了解了更多详细部分的内容,但这些成就将有助于您理解即将介绍的更详细的部分。

接下来的十五分钟

在《The TinkerPop Workout — by Gremlin》的前五分钟中,您学习了一些遍历图的基础知识。当然,关于图的定义方面并没有太多讨论。图是由顶点(即节点、点)和边(即关系、线)组成的集合,其中顶点是表示某个域对象(例如人或地点)的实体,而边表示两个顶点之间的关系。

在这里插入图片描述

上图显示了一个图,其中有两个顶点,一个唯一标识符为"1",另一个唯一标识符为"3"。它们由一个唯一标识符为"9"的边连接起来。重要的是要考虑到边缘具有方向,从顶点"1"指向顶点"3"。

重要:大多数TinkerPop实现不允许分配标识符。它们将为它们自己分配标识符,并忽略您尝试分配给它们的已分配标识符。
只有具有标识符的元素的图并不构成数据库。为了给这个基本结构赋予一些含义,可以给顶点和边缘分别添加标签以对它们进行分类。

在这里插入图片描述

现在您可以看到,顶点"1"是一个"person",顶点"3"是一个"software"顶点。它们由一个"created"的边缘连接,这使得您可以看到"person创建了software"。"label"和"id"是顶点和边缘的保留属性,但您也可以添加自己的任意属性:
在这里插入图片描述

这个模型被称为属性图,它提供了一种灵活而直观的建模数据的方式。

创建一个图

顶点、边缘和属性构成Gremlin自身存在的要素,正如对于您来说同样直观,对Gremlin自己来说可能更直观,因为顶点、边缘和属性构成了他的存在。当开发遍历时,将我们的朋友Gremlin想象成在图上移动是非常有帮助的,因为将遍历器的位置设为Gremlin有助于确定您需要他去哪里。让我们以我们上面讨论的两个顶点和一个边缘的图为例。首先,您需要创建这个图:

gremlin> graph = TinkerGraph.open()
==>tinkergraph[vertices:0 edges:0]
gremlin> g = traversal().withEmbedded(graph)
==>graphtraversalsource[tinkergraph[vertices:0 edges:0], standard]
gremlin> v1 = g.addV("person"
  • 26
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

BigDataMLApplication

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值