项目中需要使用图数据库JanusGraph,在官网学习的过程中遇到了不少坑,记录一下。
前提:电脑成功安装并配置了hadoop,hbase,zookeeper并通过start-all.sh start-hbase.sh zkServer.start命令将其启动。
这里只提供本地启动的方式,不提供连接远程服务器的方式,如有需要移步->JanusGraph官网教程
下载并解压官网教程中的压缩包,进入目录
$ cd janusgraph-0.5.2
$ ./bin/gremlin-server.sh start
$ bin/gremlin.sh
\,,,/
(o o)
-----oOOo-(3)-oOOo-----
09:12:24 INFO org.apache.tinkerpop.gremlin.hadoop.structure.HadoopGraph - HADOOP_GREMLIN_LIBS is set to: /usr/local/janusgraph/lib
plugin activated: tinkerpop.hadoop
plugin activated: janusgraph.imports
gremlin>
现在,Gremlin服务器正在本地计算机上运行,并等待客户端在默认端口上进行连接8182。要实例化客户端(如前所述),请运行gremlin.sh脚本。同样,将显示本地Gremlin控制台。这次,我们将把Gremlin Console连接到远程服务器,而不是在本地使用它,并将其所有查询重定向到该服务器。这是通过使用以下:remote命令完成的:
gremlin> :remote connect tinkerpop.server conf/remote.yaml ==>Configured localhost/127.0.0.1:8182
从日志中可以看出,在这种情况下,客户端和服务器在同一台计算机上运行。使用其他设置时,您要做的就是修改conf/remote.yaml文件中的参数。
接下来提供使用hbase并且不用Elasticsearch索引的方式载入官网的数据例子“众神之图”,
gremlin> graph = JanusGraphFactory.open('conf/janusgraph-hbase.properties')
==>standardjanusgraph[cql:[127.0.0.1]]
gremlin> GraphOfTheGodsFactory.loadWithoutMixedIndex(graph, true)
==>null
gremlin> g = graph.traversal()
==>graphtraversalsource[standardjanusgraph[cql:[127.0.0.1]], standard]
当时在执行第一条命令时报错
Could not instantiate implementation: org.janusgraph.diskstorage.es.ElasticSearchIndex
上StackOverFlow查找后发现原因在于启动JanusGraph之后会默认给你在Hbase创建一个名为"janusgraph"的表,而gremlin的这个命令创建的表与其冲突,进入Hbase将前一个表删除即可,具体操作:
hbase shell
disable 'janusgraph'
drop 'janusgraph'
接下来就可以对该表进行操作,假设在name属性上存在唯一索引,则可以检索土星顶