文本标注开源系统Doccano、Label Studio、BRAT比较

竞品分析:

Label Studio 多模态数据标注首选,当然也可以做文本标注,但是角色权限管理没有doccano完善。

BRAT 老牌文本标注工具,擅长关系标注,构建知识图谱数据集比较有优势。界面比较粗超。

Doccano:提供了文本分类,序列标注和序列到序列的标注功能,可以为情绪分析,命名实体识别,文本摘要等创建标记数据。

Doccano标注平台UI风格不错。

主要特点:

  1. 数据导入导出
  2. 标签添加
  3. 角色权限管理
  4. 能否实现单账户同时标注,同一条数据多人标注(背靠背方式也是常用的一种标注方式,用于提高标注质量)

导入与导出
支持多文件上传,导入文件格式可以是文本, json, CoNLL(常用于NER),导出文件为json。唯一不足时多文件,不能自动区分。不过可以通过json格式增加额外的字段来实现这一功能。

标签添加
支持自定义标签颜色,标签对应的值,堪称傻瓜式配置。

角色权限管理
用户角色分为标注人员,审核人员和超级管理员。

增加用户可以在 http://127.0.01:8000/admin/ 中添加,或者命令行 doccano createuser --username user --password pass

额外功能
单一账户实测可以同时标注,多账户可以在项目中设置是否共享标注结果。

除此之外,标注平台还包含一些统计功能和辅助功能。

标注平台使用注意事项:

  1. 如果有预标注标签,下标是不计算空格的,否则标签很容易跑偏。
  2. 尽量保证导入数据无BOM utf-8格式。
  3. Label的key范围只有0~9 a~z,如果生成文件超过这个范围,会无法导入哟。


参考:https://blog.csdn.net/liuxing93619/article/details/120792216

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

才 神

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值