本文的安装是在Linux下的,Windows的不同点只在于解压部分,其他没有区别
一、下载及安装
(1)先下载brat-v1.3p1.tar.gz这个文件先下载brat-v1.3p1.tar.gz这个文件
下载地址:
https://github.com/nlplab/brat/releases/tag/v1.3p1https://github.com/nlplab/brat/releases/tag/v1.3p1
(2)解压,cd到brat-v1.3p1.tar.gz所在文件夹中,依次执行以下命令
gunzip brat-v1.3p1.tar.gz
tar -xf brat-v1.3p1.tar
cd brat-v1.3p1
(3)安装,执行以下命令
./install.sh –u
这里会提示你输入用户名 密码 邮箱,需要记住,以后需要这步设置的用户名密码登录brat。
(4)运行以下命令,启动brat
python standalone.py
注:建议用python2运行,python3可能报错
二、支持中文
brat本身是不支持中文的,如果在配置文件里定义中文会报错,解决办法是更改./server/src/projectconfig.py文件的第163行,加上中文支持即可:
n = re.sub(u'[^a-zA-Z\u4e00-\u9fa5<>,0-9_-]', '_', n)
若已启动brat,需重启brat才能支持中文标注
三、进入brat
(1)在已运行python standalone.py 的情况下,在本机浏览器访问0.0.0.0:8001
可能出现的问题:若8001端口已被占用,可在standalone.py的64行中修改端口
(2)选择文件
如果正常,应显示如下画面,图中的文件夹内部即存放需要标注的文件,点击文件夹后选择任意文件
(3)登录
若正常,应出现类似如下页面,将鼠标移至右上角,出现登录按钮,输入自己之前设置的用户名及密码,即可进行标注
四、使用brat
(1)导入文件
为每个需要标注的文件创建空的同名ann文件,如下图,放在同一个文件夹内,将文件夹放入根目录下的data文件夹中。放入之后,刷新页面,可在brat初始页找到文件夹
(2)标签修改
实体标签和关系标签均可在文件annotation.conf中修改
实体标签在文件10行到20行处进行添加
关系标签在文件20行到38行处进行添加
(3)标注方法
标注分点(实体)的标注和边(关系)的标注两种行为:
点的标注:通过光标框定一个文本串,选择标记类别
边的标注:按住点向外拖到目标点,如果类型允许就会为你加边。建议打开Option,把Annotation Option改为Normal,而不是Careful。否则完成选择之后,还需要额外点一次Ok才可以。
(4)导出文件
取出ann文件即可导出
五、其它
(1)忘记密码及添加用户
打开根目录下的config.py,在文件的49行可以修改密码和添加用户,修改完密码或增加用户后需重启brat才能正常使用
(2)添加快捷键
打开kb_shortcuts.conf文件。文件内只有两列内容,其中第一列是键,第二列是对应的标记(区分大小写),实体和关系均可在此设置快捷键。
(3)因编码原因无法导入文件
应将文件转为UTF-8,
(4)因权限原因无法导入文件
使用命令chmod –r 777类似指令修改文件