最近需要用到文本标注工具,发现了这个doccano好像看起来对用户挺友好的。但是网上很多安装教程都是基于Linux系统的,这里结合其他教程以及自己的安装过程,写一份详细的手把手安装教学~
电脑系统:win10
安装依赖:Anaconda、Git
1、用git把项目克隆到本地
git的官方下载地址:
Git - Downloadswww.git-scm.comdoccano的github主页:
GitHub - doccano/doccano: Open source text annotation tool for machine learning practitioner.github.com这个就不细说了,不会的同学可以查一下如何用git克隆项目到本地。
2、用Anaconda安装虚拟环境
- 下载安装anaconda
Anaconda的清华镜像下载:
Index of /anaconda/archive/mirrors.tuna.tsinghua.edu.cn下载好后直接安装,安装过程一路next就行。
安装成功后,在windows搜索框输入anaconda应该能看到一个prompt
- 打开prompt,用anaconda prompt创建个虚拟环境,然后激活刚创建的环境。
# 创建一个基于python3.6的环境,取名doccano,并激活这个环境
conda create -n doccano python=3.6
activate doccano
- 安装依赖
这里注意,需要你cd到刚刚你通过git把项目克隆到本地的地址。
cd到这一层后,可以看到在文件列表中有一个requirements.txt,在这里的输入:
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
这里的-i是使用清华镜像来安装依赖的意思,可以加快速度。
- make migrate
在命令行输入:
python manage.py migrate
- 注册账户信息
在命令行输入:
python manage.py create_admin --noinput --username "admin" --email "admin@example.com" --password "password"
这里双引号中的用户名、密码和邮箱可以改成你自己的。
- 创建要分配给用户的管理员、批注者和批注审批者角色
在命令行输入:
python manage.py create_roles
- 启动服务器
在命令行输入:
python manage.py runserver
- 打开网址(这一步一般会报错,不要着急)
上一步run server之后命令行会抛给你一个网址,将它粘到浏览器里打开。
打开之后往往会发现有一个OSError,报错了,别慌,我也这样,下面说怎么解决这个错误。
OSError: Error reading webpack-stats.json.
3.安装Npm以解决OSError报错
- 从官网下载Node.js安装包
安装Node.js的时候它会自动帮你安装npm,你不需要管它们是干啥的,装就行了。
安装过程一路next,它默认会把npm添加到环境变量,不讲了
安装好之后打开cmd检查一下:
node和npm查看版本都成功了,npm就安装完成了。
- 到doccano文件夹下解决报错问题
然后切换到**doccanoappserverstatic**路径下
npm install
npm run build
这两行都运行完了,你会发现原来文件里没有webpack-stats.json,现在有了。
然后关了anaconda prompt再按下图来一次:
这时候浏览器就应该能打开doccano了。
4.doccano使用注意事项
在上传待标注文本的时候,如果你是选择上传plain(txt),有两点要注意:
- 必须是utf-8编码的txt
- txt不能有空行