AI数据标注工具Doccano

Doccano是一个用户友好的开源标注工具,适用于NLP和ML任务。通过Docker部署,设置管理员账号,导入数据集如CLUEFine-GrainNER,创建标注任务,定义标签,即可开始文本标注工作,适合研究人员和开发者。
摘要由CSDN通过智能技术生成

Doccano是一款开源的标注工具,用于自然语言处理和机器学习任务。它提供了用户友好的界面,使用户能够轻松地标注文本、序列标注、文本分类和文本配对等任务。doccano支持多种标注格式,并且可以方便地与其他机器学习工具集成。它的简单性和灵活性使得它成为研究人员和开发者的理想选择。下面我们来看下如何使用工具~

Github-doccano

1. 拉取镜像

我们可以通过拉取docker镜像快速完成部署

docker pull doccano/doccano

2. 创建容器

docker container create --name doccano \
  -e "ADMIN_USERNAME=admin" \
  -e "ADMIN_EMAIL=admin@example.com" \
  -e "ADMIN_PASSWORD=password" \
  -v doccano-db:/data \
  -p 8090:8000 doccano/doccano

3. 启动容器

docker container start doccano

可以看到后台已经正常运行起来

docker ps

4. 打开页面

http://xx.xx.xx.xx:8090

5. 登录Doccano

使用上文中设置的账号密码就行登录

6. 创建标注任务

7. 导入待标数据

如果没有数据可以下载CLUE Fine-Grain NER的数据集 。这个数据集是在清华大学开源的文本分类数据集THUCTC基础上,选出部分数据进行细粒度命名实体标注,原数据来源于Sina News RSS.下载链接如下👇🏻

样例数据下载

导入json数据

查看待标注数据

8. 创建标签

因为我需要做用户个人信息的识别,所以生成了银行卡身份证QQ号等信息

9.开始标注

滑动文本标注内容,接下来就是漫长的达标工作。

参考:

  1. CLUE Fine-Grain NER
  2. doccano-github

欢迎关注 一起成长

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

罗杰海贼团

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值