NLP数据标注工具调研

静~墨

于 2020-11-16 20:32:43 发布

阅读量1.3k

点赞数 1

分类专栏： NLP 信息抽取文章标签：自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_29496135/article/details/109728686

版权

本文介绍了多个开源的数据标注工具，特别关注于中文事件抽取任务。BRAT和YEDDA被推荐用于中文领域的事件抽取样本标注，两者支持中文标注且功能涵盖事件抽取。BRAT具备扩展性，而YEDDA基于主动学习。其他如Prodigy专注于英文，Chinese-Annotator为中文命名实体和关系识别设计，Doccano支持多语言标注。选择合适的工具能有效减少人工标注时间和错误。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

数据标注工具调研

一、开源数据标注工具
二、总结
三、参考：

中文nlp领域比较困扰的点在于缺乏数据，尤其像事件抽取这样的任务，人工标注非常耗时费力，而且很容易出错，所以想要搭建一个针对事件抽取的标注系统。在调研如何造轮子时，发现有些开源工具或许可以用，或许可以避免这部分的时间消耗。

一、开源数据标注工具

1. BRAT

安装环境：osx或者linux系统，windows（linux虚拟环境）
标注任务支持：实体关系、实体识别、事件抽取标注
标注语言支持：可适配到中文标注
标注任务扩展：可适配到Aspect-Based Sentiment Analysis方向数据标注
相关🔗
官方介绍
 BRAT项目github地址
 brat使用

2. prodigy

标注任务支持：实体抽

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。