0. 前言
- 好像网上没有什么CVAT的资料,都是需要仔细地看官方手册。
- 现在要使用了,希望写个系列,作为公司内部交流文档,也分享给像我一样没钱找人标注、不得不自己动手的标注工程师们。
0.1. 之前用过标注工具存在的问题
- 之前使用的标注工具是VoTT
- 这里不提一些标注细节,毕竟标注是体力活,工具用习惯了其实都差不多。
- 存在的主要问题是不适合多人协作。
- 之前用VoTT标注,6个人标注,碰到了很多很多问题。
- 无法导入别人的标注结果。
- 任务分配啥的需要离线处理,非常麻烦。
- 无法看到每个人的工作进度。
- 等等等等(各种辛酸泪)…
- 之前用VoTT标注,6个人标注,碰到了很多很多问题。
- 程序不稳定:VoTT是桌面应用,经常死机。
0.2. 为什么使用CVAT?
- 最主要的原因就是更适合多人协作。
- 能用于几乎所有CV相关标注任务。
- 一直在更新。
0.3. 感想
- 如果只是一个人,稍微标一些数据,其实VoTT是非常好的选择。
- 如果标注数据比较多,且涉及到多人协作,CVAT的优势就体现出来了。
- VoTT的学习成本低、安装简单、上手快;CVAT安装复杂(某同事装了一周才装完,doge),功能全。
0.4. 相关资料
-
网上CVAT相关资料非常少,要到哪里找呢?
- 首先,官方文档要全部看完,特别是用户手册。
- 其次,在Github Issues里查。
- 再次,在Gitter按关键字查。
- 最后,百度/Google关键字查。
- 都没有,就在gitter、github issue中提问(其实回复挺快的)。
-
官方资料:
- Github
- Online Demo:官方给的样例,免费试用,每个账户最大数据量500M,最多10个task
- 官方用户手册翻译
- CVPR 2019 Tutorials,以及slides
-
其他资料
1. 后续学习计划
-
CVAT 安装采坑大全
- 已经在公司服务器(Ubuntu Server 16.04)、自己的电脑(Ubuntu 16.04 Desktop)、阿里云服务器(Ubuntu Server 18.04)上成功安装各种版本的CVAT(v1.1.0/v1.2.0-alpha/develop)。
- 踩了不少坑,应该能够帮助到一些向我一样的菜鸡。
-
CVAT 的一个简单例子
- 在刚刚安装好CVAT的情况下,如何标注一个简单的bbox例子。
- 希望能够用到尽可能多的功能,虽然不介绍每个功能细节,但展示一下有这些功能。
-
CVAT 界面节本介绍
- 笔记已完成,请参考《CVAT 使用(1) 界面与标注功能介绍》
- 这笔记没啥内容,可以看成是自己看用户手册的笔记,主要是自己先整体了解下CVAT支持哪些功能。
- 主要内容:
- 介绍CVAT标注界面。
- 介绍CVAT支持的一些基本功能。
-
用户管理功能详解
-
笔记已完成,请参考 《CVAT 使用(2) 用户管理》
-
值得一提的是,目前*(2020.12.5)版本的CVAT用户管理存在问题,开发团队说正在开发新的权限管理功能。
-
主要内容有:
- 超级用户有哪些权限,能够实现哪些功能。
- 普通用户存在哪些权限。
-
-
CVAT中的Tasks和Jobs详解
-
笔记已完成,请参考《CVAT 使用(3) Tasks/Jobs 的创建与管理》
-
主要内容包括:
- tasks 创建的详细介绍。包括 labels 的详解。
- jobs 的创建。
- CVAT 中提供的 tasks/jobs 管理功能。
-
-
预训练模型相关详解(半自动标注)
- 如何实现半自动标注。
- 提供了哪些预训练模型。
- 如果我们自己有模型,该如何导入使用。
-
多人协作标注探索
- 多人协作时,有哪些不同权限。
- 分配、标注、审核等基本流程是啥,在哪里实现。
-
标注过程详解(包括标注小技巧)
- 根据标注任务,介绍基本标注流程。
- 介绍快捷键的使用。
- 介绍其他一些遇到的问题。
- 包括输入导入形式。
-
标注结果导入与导出
- 标注结果导出形式是什么样的,要如何导出,还有哪些选项。
- 如何导入已有的标注数据?
2. 官方文档整理与阅读
-
Installation guide,即安装文档。更多相关内容请参考本文的第三章。
- 主要内容包括在Ubuntu 18.04/Win10/Mac上的基本安装流程。
- 还有一些安装过程中的可选项:设置代理、半自动标注部署、停止所有container、设置自定义域名/IP、邮箱验证、共享硬盘等功能。
-
User’s guide,即用户手册
- 这一部分内容最多了,只写一下包括哪些内容,更多信息在详细使用记录里面写。
- Getting Started:入门教程,刚装好CVAT后要如何进行第一次标注,并介绍了半自动标注与搜索功能。
- Interface of the annotation tool:简单介绍CVAT的界面,其本质就是介绍CVAT有的功能。
- 介绍了CVAT中的几种模式,即 shape mode、track mode、attribute annotation mode。
- 介绍了几种常见标注的方式以及基本操作流程,即annotation with rectangle by 4 points/polygons/polylines/points/cuboids/tags/polygons
- 介绍了自动标注功能,即Automatic annotation。
- 还有Shape Group(类似于组合)、Filter(过滤annotation)功能。
- 介绍了所有可用的快捷键。这个非常有用,可以从头到尾看一遍。标注过程中,快捷键能够极大地提高效率。
-
XML annotation format:当从CVAT中下载标注结果的时候,很可能就是XML格式的。
-
Django REST API:部署后提供了一些api,不过我不太关心。
-
Datumaro dataset framework:数据集管理工具,好像有一些格式转换、质量检查等功能。
-
Command line interface:命令行工具,一个python脚本,提供了tasks管理、下载图片、下载annotations的功能。
-
AWS deployment Guide:AWS部署的注意事项
-
Questions:如何提问