1. 安装
- 从neo4j官网下载需要的desktop社区版本(免费),windows/osx/linux,下载之前需要注册登记个人信息,之后会给出激活码,用于后续安装过程中软件的激活。
- 具体的安装步骤,官网也给出了,个人用的osx版本。
- 下载完成之后,选择激活码的方式进行软件环境加载,如下图。
- 加载完成之后的页面。
2. 导入CSV数据
以下内容翻译自官方教程
根据数据量的大小,有三种方式导入方式,不同方式的标准和功能也不一样:
LOAD CSV
Cypher command:适合小于千万级的数据量;neo4j-admin
bulk import tool:适合加载大规模的数据集;- Kettle import tool:超大规模的数据可以采用这种方式,包含数据流的映射和执行步骤,当然也要非常熟悉这个工具。
1. LOAD CSV
NEO4j图数据库使用Cypher语句作为查询和操作语句,类似于SQL语句。在Cypher语句使用手册里面,专门有一页讲load csv
命令的,地址。这里只是粗略地介绍个人使用过程,参考教程【从桌面导入CSV文件】,依旧给出地址。
选择LOAD方式加载CSV文件,文件需要具有以下特征:
- 字符编码格式是utf-8;
- 最后一行的结束标志是系统默认的,unix: ‘\n’; windows: ‘\r\n’;
- 元素分割符号是’,’;
- 可以使用
FIELDTERMINATOR
更改元素分隔符; - 字符串引用格式,但是读数据的时候,引用符号会被扔掉;
- 字符用双引号引用;
- 如果
dbms.import.csv.legacy_quote_escaping
设置为默认值或者true
,\
会被当作转义字符; - 双引号必须在带引号的字符串中并使用转义字符或第二个双引号进行转义。
提供两种加载方式供参考:
- 如果将文件load到neo4j操作台上面,可以copy file path,进行CSV的加载。
LOAD CSV FROM "http://localhost:11001/project-d04898ce-8135-42b8-8a18-17521bb9a198/car_crawler_data.csv" As row
return row
-
从桌面直接导入,与教程【从桌面导入CSV文件】的操作方法一致
打开新建数据库的settings文件,
dbms.directories.import=import
默认导入数据的文件夹是import,因此将需要导入的数据拖入该文件夹就可以使用如下命令,加载CSV文件。
LOAD CSV FROM "file:///car_crawler_data.csv" AS