nebula graph调研

shlhhy

已于 2022-09-29 11:04:00 修改

阅读量519

点赞数

分类专栏： ES 文章标签： python

于 2022-08-30 15:02:29 首次发布

本文链接：https://blog.csdn.net/shlhhy/article/details/126604169

版权

ES 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1. 集群部署

下载安装包，并拷贝到3台服务器上

wget https://oss-cdn.nebula-graph.com.cn/package/3.2.0/nebula-graph-3.2.0.el7.x86_64.rpm

采用如下命令安装，建议安装到默认位置：/usr/local/nebula/

rpm -ivh nebula-graph-3.2.0.el7.x86_64.rpm

修改配置文件：nebula-graphd.conf、nebula-metad.conf和nebula-storaged.conf，除了下图的2个配置参数外，其它采用默认参数，即可，不同服务器上的local_ip需要根据服务器ip进行相应修改

--meta_server_addrs=ip1:9559,ip2:9559,ip3:9559
# Local IP used to identify the nebula-graphd process.
# Change it to an address other than loopback if the service is distributed or
# will be accessed remotely.
--local_ip=ip1

启动，并检查集群状态，可以看到storaged服务是不正常的，这是因为第一次部署时，必须先使用ADD HOSTS添加Storage主机，才能正常通过Storage服务读写数据

/usr/local/nebula/scripts/nebula.service start all
/usr/local/nebula/scripts/nebula.service status all

在这里插入图片描述

下载console工具：https://github.com/vesoft-inc/nebula-console/releases，注意console版本需要和nebula版本一致，下载后重命名为nebula-console
通过console工具进入nebula，并添加Storage主机，查看各节点状态

./nebula-console -addr ip1 -port 9669 -u root -p nebula
ADD HOSTS ip1:9779, ip2:9779, ip3:9779
SHOW HOSTS;

2.python连接

安装依赖

pip install nebula3-python==3.2.0

python连接示例参见：https://github.com/vesoft-inc/nebula-python/tree/release-3.1/example

nSQL的语法有点类似sql和cphyer的混合体，如果两方面都有基础的话，上手挺快的。

3.备份

备份的使用限制蛮多的，只有全量备份，无法增量备份等，不过有比没有好。

下载备份工具的源码

git clone https://github.com/vesoft-inc/nebula-br.git

设置go的依赖下载环境（这里默认对go有一定了解）

 go env -w GOPROXY=https://goproxy.cn

编译，出现下图即为编译成功

cd /opt/145_graph/nebula-br
make
bin/br version

在这里插入图片描述

4. 使用基础知识

4.1 原生索引

nebula graph的索引不用于查询加速，仅用于点和边的定位。
使用lookup和match查询语法之前必须创建索引。

4.2 es索引

通过listener插件可以将storage中存储的节点和边，同步到es引擎中。
但是基于es创建的全文索引，使用限制非常多，几乎没有实际应用价值。
但数据同步还是不错的，对于有es基础的用户而言，可以直接使用es本身的查询功能，更强大，而不必受限于nebula graph

在console中注册es客户端连接

SIGN IN TEXT SERVICE (ip:9200, HTTP);

在这里插入图片描述

部署listener服务，复制修改etc目录下的nebula-storaged-listener.conf配置文件，启动服务

cd /usr/local/nebula
./bin/nebula-storaged --flagfile /usr/local/nebula/etc/nebula-storaged-listener.conf

在这里插入图片描述

为space添加es同步

ADD LISTENER ELASTICSEARCH listener_ip:

4.3 nebula import

下载nebula import工具：https://github.com/vesoft-inc/nebula-importer/releases/tag/v3.2.0
编写yaml文件，执行命令：./nebula-importer --config nodes_config.yaml

version: v3
description: zh
removeTempFiles: false
clientSettings:
  retry: 3
  concurrency: 10
  channelBufferSize: 128
  space: zh
  connection:
    user: root
    password: nebula
    address: IP1:9669,IP2:9669,IP3:9669
logPath: ./test.log
files:
 1. path: ./test-node.csv
  failDataPath: ./nodes-err.csv
  batchSize: 128
  inOrder: false
  type: csv
  csv:
    withHeader: true
    withLabel: false
    delimiter: ","
  schema:
    type: vertex

个人比较喜欢使用带header的CSV文件，csv文件样式如下。这里简单比较一下nebula import和neo4j import的区别：

nebula import随时可以使用，但是速度比neo4j import慢一点，neo4j import只能用于数据库的第一次初始化，后续得用其它写入方式
nebula import的CSV文件需要自行生成节点id列，而neo4j import会为每个节点赋一个自增的id
neo4j中节点的类别是由label指定，label是csv文件中单独的一列，而nebula中节点的类型是tag，在csv中不是单独的一列，只是某一属性的所属空间，定义某一属性列。因此导入csv时，如果节点有很多tag，不同的tag有不同的属性，那么csv文件需要根据tag分开成一个个文件，不是很友好。

nebula csv文件
在这里插入图片描述
neo4j csv文件，id不用写在csv文件中，neo4j导入一个节点会赋一个自增的id

4.4 删除节点

nebula中似乎没有删除节点这一概念，只能删除某一id的节点的tag和相应的属性，但id本身不会被删除。
如果希望删除某一tag的所有节点，需要写一个脚本，match (v:tag) return id(v) ，然后根据获取的v逐个删除。

DELETE TAG * FROM '1';

在这里插入图片描述

5. k6压测

为了测试nebula的性能，采用其官方的压测工具进行。参考文档：https://github.com/vesoft-inc/nebula-bench/blob/release-1.2/README_cn.md

5.1 环境准备

go环境：go的版本如果低了，后面编译可能出问题

wget https://dl.google.com/go/go1.18.3.linux-amd64.tar.gz
tar -C /usr/local/ -zxvf go1.18.3.linux-amd64.tar.gz
sed -i '$aexport GOROOT=/usr/local/go\nexport PATH=$PATH:$GOROOT/bin' /etc/profile
source /etc/profile
go version
# go get 的包下载不下来，需要设置 golang 代理
export GOPROXY=https://goproxy.cn

mvn及其它编译环境

sudo yum install -y git \
                    make \
                    file \
                    libev \
                    libev-devel \
                    gcc \
                    wget \
                    python3 \
                    python3-devel \
                    java-1.8.0-openjdk \
                    maven

安装包下载

# nebula bench工具
git clone https://github.com/vesoft-inc/nebula-bench.git
# 安装nebula-bench的依赖包
pip3 install --user -r requirements.txt
# 下载k6插件，nebula-import，go的环境
# 如果上述环境已经有了，就不会重复下载了
# 在Linux上运行时，记得将scripts下的sh文件转为LF格式，否则可能出错等
/bin/bash scripts/setup.sh
# k6插件
# 如果git下载不下来，可以去网页手动下载
git clone https://github.com/vesoft-inc/k6-plugin

生成LDBC数据，这是官方用来压测的工具

python3 run.py data

数据入库：写入指定的图数据库

python3 run.py nebula importer -a 127.0.0.1:9669

在这里插入图片描述
6. 测试

# 一跳
python3 run.py stress run -scenario go.Go1Step --args='-u 10 -d 1s'
# 二跳
python3 run.py stress run -scenario go.Go2Step --args='-u 10 -d 1s'

shlhhy

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
nebula graph调研

但数据同步还是不错的，对于有es基础的用户而言，可以直接使用es本身的查询功能，更强大，而不必受限于nebula graph。通过listener插件可以将storage中存储的节点和边，同步到es引擎中。nebula graph的索引不用于查询加速，仅用于点和边的定位。但是基于es创建的全文索引，使用限制非常多，几乎没有实际应用价值。使用lookup和match查询语法之前必须创建索引。............
复制链接

扫一扫

专栏目录