Linux 服务器上安装 Virtuoso 数据库并导入数据（超详细）

最新推荐文章于 2025-03-16 15:18:19 发布

牧之原

最新推荐文章于 2025-03-16 15:18:19 发布

阅读量1w

点赞数 16

分类专栏：知识工程文章标签：数据库 nosql 后端

本文链接：https://blog.csdn.net/Mr_TangGuo/article/details/111586075

版权

知识工程专栏收录该内容

2 篇文章

订阅专栏

Virtuoso安装

一、Virtuoso简介
二、Virtuoso下载
三、Virtuoso安装与启动
四、数据导入
- 1.可视化界面导入数据
- 2.命令行中`isql`语句导入数据
五、其它
- 1.virtuoso.ini设置
- 2.References

一、Virtuoso简介

(1) virtuoso数据库是一个高性能的rdf数据库，可支持百亿条三元组，支持sparql1.1语法查询。
(2) Virtuoso是一个图数据库，同时支持SparQL。

二、Virtuoso下载

开源版本的virtuoso数据库(以7.2.6为例)，下载地址点击此处，然后下载第一个最大的压缩包即可！

download page

三、Virtuoso安装与启动

以我的linux服务器用户目录/home/spence为例：
my dirctory

1. 在当前用户目录新建目录`virtuoso`并进入该目录：

spence@main-server-8:~$ mkdir virtuoso
spence@main-server-8:~$ cd virtuoso
spence@main-server-8:~/virtuoso$

2. 将下载好的压缩包放入此目录并解压：

spence@main-server-8:~/virtuoso$ tar -zxvf virtuoso-opensource.x86_64-generic_glibc25-linux-gnu.tar.gz

解压成功后目录内容如下：
content

3. 进入`virtuoso-opensource`目录并配置：

进入virtuoso-opensource/database/目录：

spence@main-server-8:~/virtuoso$ cd virtuoso-opensource/database/

复制并重命名virtuoso.ini.sample为virtuoso.ini：

spence@main-server-8:~/virtuoso/virtuoso-opensource/database$ cp virtuoso.ini.sample virtuoso.ini

4.使用vi命令配置用户环境变量

spence@main-server-8:~/virtuoso/virtuoso-opensource/database$ vi ~/.bashrc

然后加入以下语句，记得更改语句中用户路径为你自己的用户路径，即语句中的/home/spence：

export VIRTUOSO_HOME=/home/spence/virtuoso/virtuoso-opensource
export PATH=.:${VIRTUOSO_HOME}/bin:$PATH

保存后退出，然后使用以下命令使环境变量配置生效：

spence@main-server-8:~/virtuoso/virtuoso-opensource/database$ source ~/.bashrc

5.启动Virtuoso服务

为了启动Virtuoso之后我们仍然能进行其它操作，此处我使用screen命令新开虚拟窗口，你也可以使用其它命令诸如nohup命令使得Virtuoso服务在后台运行。

spence@main-server-8:~/virtuoso/virtuoso-opensource/database$ screen -S vir

然后启动Virtuoso服务：

spence@main-server-8:~/virtuoso/virtuoso-opensource/database$ virtuoso-t -fd

出现以下内容说明服务启动成功！

success
*从日志信息可以看出此时服务运行于默认的8890端口（你也可以在前面的virtuoso.ini配置文件中设置运行端口）

服务启动后，你可以使用快捷键ctrl-A + ctrl-D返回主窗口(screen)进行其它操作。

6.查看Virtuoso可视化主界面

在本地打开浏览器，以Chrome浏览器为例，在浏览器url栏输入：服务器IP:8890即可，以我的服务器IP为10.10.10.8为例：

main page
看到这个界面的话，恭喜你，你成功配置并启动了Virtuoso服务！

四、数据导入

当然，对于我们使用Virtuoso数据库的开发者、研究者而言，只安装没什么稀奇的。接下来才是重头戏，我们需要把我们自己的数据导入到该数据库，并使用SparQL语句实现数据的查询。
(1) 注意，接下来的数据文件我均使用*.nt文件作为示例，其它RDF文件诸如*.ttl等导入操作相同。以下为Virtuoso支持的数据格式：
support

(2) 首先，我们来看一下目前Virtuoso已有哪些Graph：点击可视化界面左上角的conductor按钮，然后使用默认账号用户名：dba 密码：dba进行登录。
login
(3) 登陆成功后依次点击：Linked Data -> Graphs -> Graphs 即可看到当前数据库中的所有Graphs，可以理解为图数据表，内容如下：
data table

1.可视化界面导入数据

在这个可视化界面，我们可以直接导入数据，但前提是这个数据文件（此处为.nt文件）不能太大，如果太大的话会导入失败，亲测如此！至于多大的文件才叫‘太大’，这个就很玄学。一般来说，几个G大小的文件还是勉强可以导入的，如果更大的话，你还是使用方法2的isql来进行导入吧！

(1) 点击Linked Data -> Quad Store Upload，进入如下页面即可导入数据。需要注意的是，最后一栏的Named Graph IRI你最好改成你需要的名字！（再次导入其它数据文件到这个Graph里面时，只需要保证 Named Graph IRI 一致即可）
upload page

比如，我导入了一个.nt文件，在pyCharm中打开该.nt文件内容是这样的：

pycharm

导入该文件至Virtuoso中，然后将Named Graph IRI命名为http://www.acemap.info，导入完成后，再次进入Linked Data -> Graphs -> Graphs界面，就可以看到自己导入的数据表了，如下：

my data table
(2) 使用SparQL语句来查询试试
新开浏览器标签并输入http://10.10.10.8:8890/sparql(再提醒一次，记得把IP改为你自己的服务器IP！这个真的很重要！！！)，会出现以下查询界面：

sparql

输入我们刚刚创建的Graph IRI，我的是http://www.acemap.info，SparQL查询语句的话就限制查询100条出来吧，语句就是select * where {?x ?y ?z} LIMIT 100，然后点击下方的Run Query即可，然后就出现了神奇的一幕：
result
至此，我们就完成了使用可视化界面导入数据的流程。但是，我们可以轻易地发现这种方式的弊端。第一个就是我在前文中所说的，太大的数据文件会导致导入数据失败；第二个，我们需要导入的数据可能是多个.nt数据文件，使用这种方法导入则耗时耗力。那么，为了解决这些问题，我们可以使用接下来的方法，使用isql进行数据的批量导入！

2.命令行中`isql`语句导入数据

首先是数据，在目录/home/spence/acekg_data_collection/geokg/下，我有一大堆.nt的数据文件，如下图：
dataset
回到之前的 linux 命令行中，我们使用了Ctrl-A + Ctrl-D回到主窗口（screen），当前目录为/home/spence/virtuoso/virtuoso-opensource/database

我们现在要做的就是使用isql语句把这些数据全部导入同一个 Virtuoso 数据库的Graph中，命名就为https://www.acekg.cn.

(1)修改virtuoso.ini配置文件

spence@main-server-8:~/virtuoso/virtuoso-opensource/database$ vi virtuoso.ini

把这个配置文件中的这一行的共享目录/usr/share/proj改为自己所有数据文件所在的目录，比如我的数据文件目录就是上面的/home/spence/acekg_data_collection/geokg/。

修改前：
alter1

修改后：
alter2
保存后退出！
然后就是最重要的一步，重新启动virtuoso服务，一定要记住，修改过virtuoso.ini配置文件之后一定要重新启动，否则新的配置不会生效！
重启步骤如下：
1.进入screen vir

spence@main-server-8:~/virtuoso/virtuoso-opensource/database$ screen -r vir

2.使用快捷键Ctrl-C关闭virtuoso服务，然后再次启动virtuoso服务即可：

spence@main-server-8:~/virtuoso/virtuoso-opensource/database$ virtuoso-t -fd

(2) 下载vsql文件
在当前目录下新建一个vsql文件，名字随意，比如我新建了一个load.vsql文件。前往官网，将下面的代码复制并写入load.vsql文件后保存：
vsql
此时load.vsql文件内的内容如下：

(3) 启动isql
！！重要提示！！
如果你的服务器中已经安装了Anaconda环境，你还需要额外进行一步操作，将/home/spence/virtuoso/virtuoso-opensource/bin/目录下的isql重命名为isql-v，这样做的目的是避免和Anaconda中的isql出现冲突；如果你没有装Anaconda环境，那么这一步请忽略，并且后面我使用的isql-v命令你自动替换成isql命令即可！
如下：
rename