1 deepdive的安装:
在你成功安装完jdk1.8之后,接下来安装deepdive。
(1)下载CNdeepdive,解压(双击提取即可,例如提取到桌面)。解压之后,打开该文件夹将压缩文件删除。
如下图所示:
(2)运行install.sh,选择1安装deepdive。
配置环境变量,deepdive的可执行文件一般安装在~/local/bin文件夹下。 在~/.bashrc下添加如下内容并保存:
export PATH="/root/local/bin:$PATH"
然后执行source ~/.bash_profile设置环境变量。
如图所示:
点击右上角button保存。
2 postgresql安装:
运行:
bash <(curl -fsSL git.io/getdeepdive) postgres
如图所示:
3 nlp环境安装:
运行nlp_setup.sh,配置中文standford nlp环境。
如图所示:
4 项目框架搭建:
建立自己的项目文件夹project(例子是transaction(mkdir 文件夹名即可)),在本地postgresql中为项目建立数据库,再在项目文件夹下建立数据库配置文件:
echo "postgresql://$USER@$HOSTNAME:5432/db_name" >db.url
再在project下分别建立输入数据文件夹input,脚本文件夹udf,用户配置文件app.ddlog,模型配置文件deepdive.conf, 可参照给定的transaction文件夹样例格式。
(project文件夹中是已经建立完毕的项目,后面所需的脚本和数据文件都可以直接复制)
deepdive定义了很多自己的语法规则和自动化脚本,导入数据库的过程一般为deepdive do db_name指令,用户通过配置app.ddlog指示数据流。