本文对Titan/Gremlin的查询过程进行分析,为了简化明了,直接使用例子说明。
查询g.v(1).out.has(name, "David"),当前titan的做法是:
v(1)把v1的id找出来,返回该id
--> out从上一步结果集合中,拉出一个,即v1的id,并把该点对应的那行数据从hbase里读取出来(即该点的属性、相邻点、相邻边),找出出度节点,返回结果resO
--> has把resO中的第一个节点拉出来,把该点对应的属性字段从hbase里读取出来,并进行name为david的过滤,返回结果
--> 迭代执行has,遍历resO完毕
再如查询g.v(1).out.out.has(name, "David"),当前titan的做法是:
v(1)把v1的id找出来,返回该id
-->out从上一步结果集合中,拉出一个,即v1的id,并把该点对应的那行数据从hbase里读取出来(即该点的属性、相邻点、相邻边),返回出度节点,返回结果resO
-->out从上一步结果结合resO中,拉出一个,即把第一个出度点拉出来,并把该点对应的那行数据从hbase里读取出来(即该点的属性、相邻点、相邻边),找出出度节点,返回结果resO
-->has把resO2中的第一个节点拉出来,把该点对应的属性字段从hbase里读取出来,并进行name为david的过滤,返回结果
--> 迭代执行has,直至resO2遍历完毕
-->继续执行倒数第一个out,直至resO遍历完毕
-->继续执行倒数第二个out,直至id遍历完毕(因为就是v1,所以不需要再遍历)
每一步可以先想象一下单独执行的结果,就很清楚明了了。