一、RDF文件导入fukesi
1. 数据准备
爬虫下来的数据,转为RDF数据,我的DRF数据是N-Triple格式,路径为D:\data.nt,数据库路径为D:\mydb
2. 安装Jena+fuseki
我的JAVA环境为1.8.3(以配置好JDK环境),使用Jena3.17.0,fuseki3.16.0(Jena4.x系列需要JAVA11,fuseki3.17.0在web上显示有问题,不显示数据库)Index of /dist/jena/binaries
两个文件解压后放在同一目录,然后配置环境
创建变量JWNA_HOME=E:\down\jena\apache-jena-3.17.0
PATH中添加变量%JENA_HOME%\bat
3. 启动fuseki,导入RDF
3.1 启动fuseki
进入fuseki所在目录,打开cmd,fuseki-server.bat启动,或者直接打开fuseki-server.bat,启动成功后会生成run文件
fuseki-server.bat
3.2 指定数据库
RDF为D:\data.nt,数据库路径为D:\mydb(空文件)
--loc = 数据库路径,--update
: 允许对数据进行更新操作,/testds 存储数据集的名称
fuseki-server.bat --update --loc=D:\mydb /testds
3.3 上传RDF文件
我这里直接在fuseki管理器里上传
也可以使用TDB上传,在jena目录中打开CMD,输入命令
tdbloader.bat --loc d:\tdb d:\rdf.nt
4. 编写问答系统
5. 报错
5.1 refo安装包报错
python refo0.13 安装失败错误AttributeError: module ‘distutils.util‘ has no attribute ‘run_2to3‘
原因是因为setuptools高版本不支持use_2to3:
回退setuptools版本
pip install setuptools==56.0.0
离线安装refo0.13,防止自动更新setuptools为高版本,注意路径书写格式
pip install E:\down\REfO-0.13
成功安装