文本标注工具--BRAT 安装

brat是linux下的一款应用于webserver端的文本标注工具,可用于标注如下类型信息:

  1. 实体:命名实体,可用于NER;
  2. 关系:实体间关系,可用于关系抽取;
  3. 事件:实体参与的事件;
  4. 属性:事件或实体的属性,常用于知识图谱。

安装web 环境

1 安装apache
sudo apt-get upgrade
sudo apt-get update
sudo apt-get install apache2

安装完毕后,会在 /var 目录下生成一个www/html目录,下面bart的安装路径均在其中:

cd /var/www/html

2 修改apache配置文件

这里主要是修改配置文件apache2.conf中的“<Directory /var/www/>”这一项,在这一项内部添加brat官网的配置项内容

cd /etc/apache2/
#先备份一下吧,以免误改后恢复不到原始内容了。
sudo cp apache2.conf apache2.conf.bak
#编辑apache2.conf
sudo vi apache2.conf
## ubantu环境
#sudo vi /etc/apache2/apache2.conf
# centos环境
#sudo vi /etc/httpd/conf/httpd.conf

把配置文件apache2.conf中“<Directory /var/www/>”这一部分的内容改成下边的样子(注意缩进,若启动apache2服务时候报错“…the control process exited with error code…”,建议手动缩进(4下空格键))

<Directory /var/www/>
    Options Indexes FollowSymLinks
    Require all granted
    AllowOverride Options Indexes FileInfo Limit
    AddType application/xhtml+xml .xhtml
    AddType font/ttf .ttf
    # For CGI support
    AddHandler cgi-script .cgi
    # Comment out the line above and uncomment the line below for FastCGI
    #AddHandler fastcgi-script fcgi
</Directory>

备选配置(需要建立软连接):

'''
<Directory /var/www/html/brat>
  AllowOverride Options Indexes FileInfo Limit
  Require all granted
  AddType application/xhtml+xml .xhtml
  AddType font/ttf .ttf
  Options +ExecCGI
  AddHandler cgi-script .cgi
</Directory>
'''
#建立Apache2和cgi模块的软链接(上面的配置需要)
#cd /etc/apache2/mods-enabled
#sudo ln -s ../mods-available/cgi.load

这里如果使用普通cgi就设置普通cgi,如果使用fastcgi就注释掉普通cgi那行,打开fastcgi那行。
在配置文件apache2.conf的结尾添加服务名

ServerName localhost
3 使能userdir
#If you are not installing into public_html in your home directory, 
#adjust the above (in particular the line <Directory /home/*/public_html>) accordingly. 
#If you installed into public_html in your home directory, 
#make sure that you have the userdir module enabled
# 官方配置目录<Directory /home/*/public_html>
# 我们的是<Directory /var/www/> ,所以听人劝,吃饱饭
sudo a2enmod userdir
4 如果使用普通cgi,则启用
sudo a2enmod cgi
5 如果用FASTCGI支持,则安装并使能rewrite模块

cgi和fastcgi 选择一个就行,根据前边配置文件apache2.conf中的设置

# The final FastCGI step is detailed in .htaccess in the brat installation directory, which involves uncommenting and configuring the rewrite module.
sudo apt-get install libapache2-mod-fastcgi
sudo a2enmod fastcgi
sudo a2enmod rewrite
sudo /etc/init.d/apache2 reload
6 启动apache服务
sudo service apache2 restart

如果安装成功,则可以通过http://172.16.10.77 或http://localhost访问apache默认页,如下图所示:ip地址172.16.10.77为服务器地址

安装并配置BRAT

1)下载BRAT:brak压缩包

其他下载brat的地址:release版本

2)将软件安装包复制到apache根目录,解压,修改文件名为brat
cd /var/www/html
sudo cp /media/sf_Downloads/brat-v1.3_Crunchy_Frog.tar.gz /var/www/html/
sudo tar -xvzf brat-v1.3_Crunchy_Frog.tar.gz
sudo mv brat-v1.3_Crunchy_Frog brat
#修改brat路径权限
#sudo chmod 777 -R /var/www/html/brat
3)进入brat目录,并启动安装脚本,输入用户名、密码以及邮箱地址。
cd /var/www/html/brat
sudo ./install.sh

官方安装教程

4) 查看apache组名

(步骤4、步骤5 两步应该不需要,当前版本的brat在安装完成后会自动进行这两步操作)

sudo ./apache-group.sh
5)改变data、work目录及其下所有子目录和文件的所属组为www-data,使得apache可以有权限访问和修改
sudo chmod -R g+rwx data work

查看是否生效

ls -lh | grep data
ls -lh | grep work

6.0)运行

还是在brat目录下直接运行

python standalone.py
#如果报错的话,就换成 python2 standalone.py
6.1)打开网页,测试是否安装成功

如果成功,地址栏输入http://172.16.10.77 /brat或http://localhost/brat可以看到欢迎页


7)brat默认不支持中文标注

需手动修改brat主目录**/server/src路径下的projectconfig.py**文件的第162行代码

sudo vi /var/www/html/brat/server/src/projectconfig.py

将其改为:

# n  = re.sub(r'[^a-zA-Z0-9_-]', '_', n)
n = re.sub(u'[^a-zA-Z\u4e00-\u9fa5<>,0-9_-]', '_', n)

8)重启Apache2
# ubantu
sudo service apache2 restart
# centos
sudo systemctl restart httpd.service

访问本地brat地址,若页面正常,即安装配置无误。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值