文本标注平台搭建之brat

1. 下载安装包

下载地址:http://brat.nlplab.org/index.html
如图所示,点击download下载:
在这里插入图片描述

2. 解压,安装,启动服务

2.1 解压安装包

tar xzf brat-v1.3_Crunchy_Frog.tar.gz

2.2 切换路径

cd brat-v1.3_Crunchy_Frog

2.3 运行install.sh进行安装

./install.sh

2.4 运行standalone.py启动服务

python standalone.py

在standalone.py的第63、64行可以修改ip地址和端口号,如图所示:
在这里插入图片描述

3. 在浏览器登录

根据设置的地址和端口号,在浏览器登录,登录后如图所示:
在这里插入图片描述

3.1 登录

鼠标移动到如图所示右上角登录,不然无法进行标注。

3.2 导入数据,生成.ann文件

将数据放在brat-v1.3_Crunchy_Frog/data路径下,可以根据自己的项目新建文件夹,如test,在路径brat-v1.3_Crunchy_Frog/data/test放入需要进行标注的数据。
文件的格式是.txt的格式。
运行如下指令,生成文件夹下与.txt同名的.ann文件:

find 文件夹名称 -name '*.txt'|sed -e 's|\.txt|.ann|g'|xargs touch

注:必须要同时有.txt和.ann文件,才能进行标注。

3.3 选择需要标注的文件

在浏览器窗口中点击tab键,选择需要标注的文件进行标注,如图所示:
在这里插入图片描述
选择文件,点击OK。

3.4 开始标注

选择我们需要标注的内容,如图所示,选择系统性血管炎

在这里插入图片描述

选择之后,界面会弹出如下的标注界面,选择Disease对系统性血管炎进行标注:
在这里插入图片描述
标记完之后,点击OK,标记完成,如下图所示:

在这里插入图片描述
标记完成之后,将鼠标移至上方蓝色处,然后点击data:

在这里插入图片描述
之后会弹出如下界面,点击OK保存,标注完毕。标注后的内容会保存在.ann文件中。
在这里插入图片描述

4. 对标注的数据结构进行配置

4.1 实体添加

在brat-v1.3_Crunchy_Frog路径中,打开annotation.conf文件,添加我们需要的实体名称,如图所示,这里我们添加了Disease、Drug两个实体名称。

在这里插入图片描述

4.2 中文设置

(注:直接在annotation.conf里添加中文实体经常会报错)
在这里插入图片描述
这样,在标注的时候,就可以显示中文,如下图所示:
在这里插入图片描述

4.3 设置颜色

    在路径brat-v1.3_Crunchy_Frog路径中,打开visual.conf,找到[drawing],如图示设置颜色:

在这里插入图片描述

4.4 设置关系

在brat-v1.3_Crunchy_Frog路径中,打开annotation.conf文件,找到[relations],设置实体之间的关系,下图45~48行表示:
xx疾病 xx症状
xx疾病 推荐使用 xx药物
xx疾病 属于 xx部门
xx疾病 做了 xx检查
在这里插入图片描述
设置完关系之后,可以在浏览器界面,对于两个标注后的部分,可以从一端拖动到另一端,实现关系的标注,如下图所示:

在这里插入图片描述
**结束。**标记完成后,记得保存(怎么保存见3.4节内容)。

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值