数据标注工具调研
中文nlp领域比较困扰的点在于缺乏数据,尤其像事件抽取这样的任务,人工标注非常耗时费力,而且很容易出错,所以想要搭建一个针对事件抽取的标注系统。在调研如何造轮子时,发现有些开源工具或许可以用,或许可以避免这部分的时间消耗。
一、开源数据标注工具
1. BRAT
- 安装环境:osx或者linux系统,windows(linux虚拟环境)
- 标注任务支持:实体关系、实体识别、事件抽取标注
- 标注语言支持:可适配到中文标注
- 标注任务扩展:可适配到Aspect-Based Sentiment Analysis方向数据标注
- 相关🔗
官方介绍
BRAT项目github地址
brat使用
2. prodigy
- 标注任务支持:实体抽