今天给大家推荐一个非常非常好用的标注平台doccano,可以直接看github项目,非常容易部署且有很多文本和图片的标注任务都可以做。我一开始是因为实体识别的序列标注使用的,实际还可以做文本分类,图片的一些标注!!!!github链接如下:
GitHub - doccano/doccano: Open source annotation tool for machine learning practitioners.
pip安装
#直接pip!
pip install doccano
初始化
用户名以及密码,用终端直接启动webserver
# Initialize database.
doccano init
# Create a super user.
doccano createuser --username admin --password pass
# Start a web server.
doccano webserver --port 8000
(这里我直接起服务了)
然后重新起一个终端
# Start the task queue to handle file upload/download.
doccano task
开始标注
然后就可以开网页:
http://127.0.0.1:8000/
在右上角进行登录,登陆后就可以看到你的任务了!
以序列标注为例:可以自己添加标签,重复区域标注,最后大家可以尝试导出数据。另外,该标注平台还可以进行图片区域的标注。