读图数据库实战笔记03

1. Gremlin Server只将数据存储在内存中

2. 概念

3. 遍历图的过程

4. 使用Gremlin编写遍历

g.V().has('person', 'first_name', 'Ted').
    out('friends').values('first_name')
==＞Josh

5. 递归遍历

6. 使用Gremlin编写递归遍历

g.V().has('person', 'first_name', 'Ted').
  out('friends').
  out('friends').
  values('first_name')
==＞Hank

 g.V().has('person','first_name','Ted').
  repeat(
    out()
  ).until(has('person','first_name','Dave')).
  values('first_name')

g.V().has('person', 'first_name', 'Ted').
  until(has('person', 'first_name', 'Hank')).
  repeat(
    out('friends')
  ).
  values('first_name')
==＞Hank

g.V().has('person', 'first_name', 'Ted').
  repeat(
    out('friends')
  ).times(2).
  values('first_name')
==＞Hank

g.V().has('person', 'first_name', 'Ted').
  until(has('person', 'first_name', 'Hank')).
  repeat(
    out('friends')
  ).emit().
  values('first_name')
==＞Josh
==＞Hank
==＞Hank

读图数据库实战笔记03_遍历

1. Gremlin Server只将数据存储在内存中

1.1. 如果停止Gremlin Server，将丢失数据库里的所有数据

2. 概念

2.1. 遍历（动词）

2.1.1. 当在图数据库中导航时，从顶点到边或从边到顶点的移动过程

2.1.2. 类似于在关系数据库中的查询行为

2.2. 遍历（名词）

2.2.1. 要在图数据库中执行的一个或多个操作

2.2.1.1. 要么返回数据，要么进行更改

2.2.2. 在关系数据库中与之对应的是实际的SQL查询

2.3. 遍历源（traversal source）

2.3.1. TinkerPop特有的概念

2.3.2. 表示遍历图操作的起点或基点

2.3.3. 通常用变量g表示，并且需要位于任何遍历的开头

2.3.4. 从遍历源开始遍历，通过每个分支发送一个遍历器来遍历图

2.4. 遍历器（traverser）

2.4.1. 与遍历执行特定分支相关联的计算过程

2.4.2. 遍历器维护相关图当前分支移动的所有元数据

2.4.2.1. 当前对象、循环信息、历史路径数据等

2.4.3. 唯一遍历器表示通过数据的每个分支

2.4.4. 可以被删除，也可以带着结果返回

3. 遍历图的过程

3.1. 找到起始顶点，确定要遍历的边，遍历该边，最后到达目标顶点完成遍历

3.2. 遍历图需要我们了解图的结构，我们任何时间在图中的位置，以及每个位置的相邻边、相邻顶点和可用属性

3.3. 遍历图数据库的重点是从一个元素遍历到另一个元素

3.3.1. 在清楚地陈述业务问题并彻底理解用例之后，应该会发现我们的逻辑模型和已识别出的相关模式元素有助于编写遍历

3.4. 通过多个并行进程遍历图

3.4.1. 每个并行进程都称为遍历器

3.5. 遍历是一系列操作

3.5.1. 遍历的每个操作都是从一个位置开始，并且（几乎总是）在不同的位置结束

3.5.2. 每个操作都从上一个操作结束的位置继续

3.6. 遍历需要知道我们在图中的位置

3.6.1. 在关系数据库中，SQL查询能够在查询的任意点连接任意两个表

3.6.2. 在图中，则只能使用图中当前位置旁边的边或顶点

3.6.3. 为了有效地在整个图中导航，必须跟踪我们在图数据模型结构中的位置

3.6.3.1. 最难掌握的技能

3.7. 边的方向很重要

3.7.1. 边的有向性是图数据库的一个关键能力，对于筛选或决定要遍历哪些边非常有用

3.7.2. 关系的这种方向性与关系数据库中不同，后者中的所有关系都是双向的

3.7.3. 在图数据库中，不仅要决定边的方向，还要确定我们希望如何遍历该边

3.7.3.1. 只遍历入边、出边，还是同时遍历两者

3.8. 遍历并不包含历史记录

3.8.1. 在图数据库中，从遍历返回的唯一值是结束顶点

4. 使用Gremlin编写遍历

4.1. TinkerPop允许在Gremlin代码中使用任何模式，因此本身完全避免了模式定义的问题

4.2. 所有图查询语言都普遍需要理解筛选及边的方向性才能在图中移动

4.3. 一旦从关系数据库转移到图数据库里这种根据当前位置来考虑遍历的思考方式，我们就养成了利用数据中关系的必备思维习惯

4.4. 遍历API

4.4.1. 按照惯例以变量g开头：g =graph.traversal()

4.5. 内部API

4.5.1. 专为创建图数据库引擎的开发人员而设计

4.5.2. 图API

4.5.2.1. 就像关系数据库中可以通过C/C++、C#或Java等编程语言直接操纵位于SQL语言抽象之下的具体数据库文件的API

4.5.3. 它是一个接口，用于为Vertex（顶点）、Edge（边）、VertexProperty（顶点属性）和Property（属性）对象的集合定义容器对象

4.5.4. 它也是一种数据结构，不能提供有效的导航方式，只能提供在图中定位单个数据元素的最基本能力

4.6. 谁是Ted的朋友

4.7. api

4.7.1. g

4.7.1.1. 表示图的遍历源

4.7.1.2. 是所有遍历的基石

4.7.1.3. 可以任意命名，但是TinkerPop图数据库在事务模式下的惯例是使用g

4.7.1.4. Gremlin的关键概念：g != graph

4.7.1.4.1. g指遍历源，而不是图

4.7.2. V()操作

4.7.2.1. 返回一个包含图中每个顶点的迭代器

4.7.2.2. 两个全局图操作之一

4.7.2.3. 另一个全局图操作是E()

4.7.2.3.1. 返回一个包含图中每条边的迭代器

4.7.2.3.2. 为了维护或基于数据完整性考虑时才使用

4.7.2.4. 遍历的第二个操作始终是这两个操作之一

4.7.2.5. 使用V()从顶点开始遍历是目前最常见的做法

4.7.2.5.1. 在遍历中，几乎总是从V()开始

4.7.2.6. 为事务操作编写的每次遍历几乎都是从一个或一组顶点开始的

4.7.3. has()操作

4.7.3.1. 筛选操作

4.7.3.2. 它只经过满足以下筛选条件的顶点或边

4.7.3.2.1. 匹配指定的标签（如果指定了）

4.7.3.2.2. 具有与指定键-值对匹配的键-值对

4.7.3.3. hasLabel(label)：返回匹配指定标签类型的所有顶点或边