NLP文本标注工具与平台(数据标注公司)

最近在做NLP相关项目,包括句法分析、情感分析等,有大量数据需要标注。我评估了几个文本标注工具,也接触了几家数据标注公司和平台,总结如下,供各位参考。

文本标注平台(标注外包公司)

数据标注公司的工作比较多样,文本数据标注是最基础的,另外语音、图片、视频标注也都可以做。目前这个行业良莠不齐,有的平台技术实力强,有品牌背景,比如京东众智、百度众包,数据保密做得好。有的平台是专门做代理的,你的数据需求交给他,他转手就分包给下一层。下面介绍几个平台,也综合了其他博主的一些意见,如下:

京东众智

标注质量比较高,项目交付准时,数据隔离方案可以不出自己的服务器完成标注,比较重视客户的数据安全。也提供私有化部署服务。

百度众测

标注能力比较广泛,百度进入标注行业比较久,积累了较多的众包用户。不过我个人不看好众包模式,因为质量比较难把控。

figure-eight

国外知名的数据标注平台,国外好多大公司都与它有合作。需求方可以自行配置标注工具和相应的label,直接在平台上发任务,没有客户经理沟通…这可能对国内客户不太友好。

文本标注工具(开源)

1. Prodigy

  Website: https://prodi.gy/docs/ 

  Blog: https://explosion.ai/blog/prodigy-annotation-tool-active-learning

2. DeepDive (Mindtagger):前端比较简单,用户界面友好。 

  介绍:http://deepdive.stanford.edu/labeling 

  前端代码:https://github.com/HazyResearch/mindbender 

3.  BRAT

  介绍:http://brat.nlplab.org/index.html 

  在线试用:http://weaver.nlplab.org/~brat/demo/latest/#/ 

  代码:https://github.com/nlplab/brat

4. IEPY :工程比较完整,有用户管理系统。前端略重,对用户不是非常友好

  代码:https://github.com/machinalis/iepy 

  说明:http://iepy.readthedocs.io/en/latest/index.html

转载于:https://www.cnblogs.com/ai-nlp-cv/p/9882213.html

  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值