前言
Doccano是一款面向人类的开源文本注释工具。它为文本分类、序列标注和序列对序列任务提供标注功能。因此,您可以创建标记数据进行情感分析,命名实体识别,文本摘要等。只需创建一个项目,上传数据并开始注释。你可以在几小时内建立一个数据集。
`以下是本篇文章正文内容,下面案例可供参考
一、Doccano数据标注
- You can try the annotation demo.
如果有疑问:
- Read the documentation at the https://doccano.github.io/doccano/.
Usage
Three options to run doccano:
- pip (Python 3.8+)
- Docker
- Docker Compose
- document classification 文本分类
- sequence labeling 序列标注,用于命名实体识别
- sequence to sequence seq2seq,用于翻译
- speech to text 语音转文本标注
Docker
作为一次性设置,如下所示创建一个Docker容器
docker pull doccano/doccano
docker container create --name doccano \
-e "ADMIN_USERNAME=admin" \
-e "ADMIN_EMAIL=admin@example.com" \
-e "ADMIN_PASSWORD=password" \
-v doccano-db:/data \
-p 8000:8000 doccano/doccano
docker container start doccano
依次运行并在最后打开在这里插入图片描述
Go to http://127.0.0.1:8000/. ----- 打开你服务器或者本地的IP
To stop the container, run docker container stop doccano -t 5. All data created in the container will persist across restarts.
效果展示
很多详细方案可以参考README