BRAT是一个基于web的文本标注工具,主要用于对文本的结构化标注,用BRAT生成的标注结果能够把无结构化的原始文本结构化,供计算机处理。利用该工具可以方便的获得各项NLP任务需要的标注语料与安装.
[1] Windows系统下安装VirtualBox与Ubuntu的详细教程
[2] Virtualbox中如何实现主机与虚机(Ubuntu 14.04)之间传输文件
[3] Ubuntu 安装完成以后,一直上不了网
百度也连不上。尝试了很多办法,最后发现很简单——更新firefox 即可,两条命令。
sudo apt-get update
sudo apt-get install firefox
[4] Ubuntu安装python2.7
因为brat只支持python2, Ubuntu自带python3
sudo apt-get install python2.7
[4] Ubuntu上安装使用BRAT
more: https://wetest.qq.com/lab/view/31.html
[5] BRAT配置
5.1 annotation.conf
标记类型 configuration
5.1.1定义实体名称
5.1.2 定义实体关系
5.2 visual.conf annotation显示配置
5.2.1定义实体显示别名
5.2.2 指定实体显示颜色
5.3 数据
5.3.1 在/brat-v1.3_Crunchy_Frog/data/examples下新建自己的项目文件夹,如CervicalCancer
5.3.2 把主文件夹下/brat-v1.3_Crunchy_Frog的annotation.conf, tools.conf, visual.conf复制一份到CervicalCancer下,并按照5.1的步骤修改配置文件
5.3.4 把需要标注的txt文件放入新建的文件夹,同时新建一批同名的空的ann文件
5.3.5按照第4步开始标注