环境:VMware ubuntu虚拟机
前几天在用brat标注数据集,总结一下自己遇到的坑:
参考博客http://t.csdnimg.cn/m6R72部署brat并使用
一、下载并解压brat
官网下载:brat rapid annotation tool (nlplab.org)
解压后在解压后目录下运行python standalone.py注意:
提前安装python2.x,尝试了多种方法,还是直接pip install python最好使,直接安装了2.7版本。(我的虚拟机)
二、运行brat
python standalone.py
python standalone.py
运行会给出本地地址,复制到浏览器打开。这里我遇到了两个问题:
其一是ubuntu自带的火狐浏览器,打开后会出错,这里我又下载了一个谷歌浏览器,问题解决
其二是报错
查看终端可以看到
按照博客http://t.csdnimg.cn/4JJpE的思路解决
三、标注数据集
参考http://t.csdnimg.cn/cjOFq编写配置文件。
我们的配置文件只涉及到实体类,还算比较简单的。
brat标注
参考http://t.csdnimg.cn/5NwEt合理使用快捷键提高效率
期间我的虚拟机卡死过一回,好在brat是自动保存的。不过也是由于brat,导致虚拟机长时间开机的话会越用越卡,可以每隔一段时间重启一下。