刚开始使用Tinkerpop和Janusgraph,我正试图根据文档来解决这个问题。在我有三个数据集,每个数据集包含大约2000万行(csv文件)
有一个特定的模型,其中变量和行需要连接,例如什么是顶点、什么是标签、什么是边等等
在把所有的东西都放在一个图中之后,我当然想用一些基本的Gremlin来看看这个模型是如何工作的。在
但首先我需要一种方法把数据输入Janusgraph。在
可能有这个脚本。
但另外,用python编写,打开一个csv文件,获取变量X的每一行,并将其作为顶点/边/等等……来写吗。。。?
还是我完全误解了Janusgraph/Tinkerpop?在
提前谢谢你的帮助。在
编辑:
假设我有几个文件,每个文件包含几百万行,代表人,还有几个变量,代表不同的指标。第一个例子可能看起来像thid:metric_1 metric_2 metric_3 ..
person_1 a e i
person_2 b f j
person_3 c g k
person_4 d h l
..
我是否应该将其转换为节点首先由值[a,…,l]组成的文件。
(以及后来可能更为复杂的属性集)
然后[a,…,l]被索引了吗?在
“现代”图here似乎有一个索引(编号1,…,12表示所有节点和边,独立于它们的重叠标签/类别),例如,是否应该分别为每个度量编制索引,然后将其链接到它们所属的给定的人?在
很抱歉,这些可能是直截了当的问题,但我是相当新的。在