鼠标houver的时候提示文本_文本标注工具Brat的安装及使用

1、安装

Brat只能在Linux下运行。

先从官网下载安装包http://brat.nlplab.org/index.html,注意解压到一个不包含中文字符的目录下,不然安装后会报错。然后进入到brat-v1.3_Crunchy_Frog目录下。使用命令

./install 

就可以安装了。他会提示你输入登录名、密码、邮箱等。输入完毕就安装好了。

2、运行

还是在brat-v1.3_Crunchy_Frog目录下直接运行python standalone.py,如果报错的话,就换成python2 standalone.py。此时点击下方出现的网址,就会看到此页面了。然后点击OK,进入。此时这两个文件夹是系统存放例子的。我们可以点进入看看。

9002ef1f70f284c3aaa32343413a3e69.png

14ae0f0fc540da549dcca053753312a9.png

9ba071e9e3cc25e0fd17b0b36c934dc6.png

3、那么如何标注呢,我们先在系统给的例子上试试。对想要标注的文本用鼠标选中,诶!怎么什么反应都没有!!!这是因为我们还没有登录,无法进行标注,把鼠标放在右上角的brat上,就会出现Login,此时输入刚才我们的用户名和密码登录。

290c63bfb32d8e036f09f34c76d7d6ac.png

我们再选中需要标注的文本就会出现如下图所示信息。他这里有Entity type实体类型,Event type事件类型,还有Event attributes事件属性,这些定义都是在设置文件里定义的,一会儿我们再说。这时候你就可以随意标注了。

b0e801bce684858065233a638a02eb98.png

那么如何在我的语料上进行标注呢。假设我现在有如下语料文本test.txt,并将其放在了test_brat的文件夹,我把test_brat文件夹放在了data/目录下。如果点进去没反应就是权限不够问题,这时候你需要用

chmod 777 -R data/test_brat

命令来赋予他们读写的权利。我们还需要在test_brat文件夹中创建一个test.ann的空文件,没有该文件也无法打开,该文件是用来存放标注好的实体的。一个文件对应一个空的ann文件。如果你的文件有很多,使用命令

find 文件夹名称 -name '*.txt'|sed -e 's|.txt|.ann|g'|xargs touch

该命令对每个空的txt文件创建ann空文件。

之后我们就可以进入冬我们的语料中了。这时我们还需要定义我们的实体类型、关系属性等。我们完全可以把系统中的配置文件摘抄过来。下图中的annotation.conf就是配置文件。

f639a144aaea042ee3a003471ccb7cea.png

这里我修改成了我需要的实体类型。里面的内容如下:

ae7e7e6317423607230030190d52a368.png

我这里为了方便就很简单的定义了两种实体类型,其他relations是定义实体间的关系,events是定义事件等,定义方式可以参考例子中的。将定义好的annotation.py文件放到test-brat文件夹。

当我们再次进入时,居然有这么多的警告,

f23aab31b04532f914f13b5c6199f796.png

这是因为Brat本身不支持中文,所以我们需要设置一下。在server/src/projectconfig.py文件中进行修改。将162行的代码改成

n = re.sub(u'[^a-zA-Zu4e00-u9fa5<>u2014-uff1b,0-9_-]', '_', n)

记住,改完保存后需要重启brat才会生效。

再次进入标注文件,就可以进行标注了!

25dbd70caa1aba3037fe9d0baa327ce5.png

看下ann文件中的内容

25c67a2940db7e9819d082b0a74f8dbc.png

这就可以了!!!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值