CVAT 系列开篇

5 篇文章 2 订阅

0. 前言

  • 好像网上没有什么CVAT的资料,都是需要仔细地看官方手册。
  • 现在要使用了,希望写个系列,作为公司内部交流文档,也分享给像我一样没钱找人标注、不得不自己动手的标注工程师们。

0.1. 之前用过标注工具存在的问题

  • 之前使用的标注工具是VoTT
  • 这里不提一些标注细节,毕竟标注是体力活,工具用习惯了其实都差不多。
  • 存在的主要问题是不适合多人协作
    • 之前用VoTT标注,6个人标注,碰到了很多很多问题。
      • 无法导入别人的标注结果。
      • 任务分配啥的需要离线处理,非常麻烦。
      • 无法看到每个人的工作进度。
    • 等等等等(各种辛酸泪)…
  • 程序不稳定:VoTT是桌面应用,经常死机。

0.2. 为什么使用CVAT?

  • 最主要的原因就是更适合多人协作
  • 能用于几乎所有CV相关标注任务。
  • 一直在更新。

0.3. 感想

  • 如果只是一个人,稍微标一些数据,其实VoTT是非常好的选择。
  • 如果标注数据比较多,且涉及到多人协作,CVAT的优势就体现出来了。
  • VoTT的学习成本低、安装简单、上手快;CVAT安装复杂(某同事装了一周才装完,doge),功能全。

0.4. 相关资料

  • 网上CVAT相关资料非常少,要到哪里找呢?

    • 首先,官方文档要全部看完,特别是用户手册。
    • 其次,在Github Issues里查。
    • 再次,在Gitter按关键字查。
    • 最后,百度/Google关键字查。
    • 都没有,就在gitter、github issue中提问(其实回复挺快的)。
  • 官方资料:

  • 其他资料

1. 后续学习计划

  • CVAT 安装采坑大全

    • 已经在公司服务器(Ubuntu Server 16.04)、自己的电脑(Ubuntu 16.04 Desktop)、阿里云服务器(Ubuntu Server 18.04)上成功安装各种版本的CVAT(v1.1.0/v1.2.0-alpha/develop)。
    • 踩了不少坑,应该能够帮助到一些向我一样的菜鸡。
  • CVAT 的一个简单例子

    • 刚刚安装好CVAT的情况下,如何标注一个简单的bbox例子。
    • 希望能够用到尽可能多的功能,虽然不介绍每个功能细节,但展示一下有这些功能。
  • CVAT 界面节本介绍

    • 笔记已完成,请参考《CVAT 使用(1) 界面与标注功能介绍》
    • 这笔记没啥内容,可以看成是自己看用户手册的笔记,主要是自己先整体了解下CVAT支持哪些功能。
    • 主要内容:
      • 介绍CVAT标注界面。
      • 介绍CVAT支持的一些基本功能。
  • 用户管理功能详解

    • 笔记已完成,请参考 《CVAT 使用(2) 用户管理》

    • 值得一提的是,目前*(2020.12.5)版本的CVAT用户管理存在问题,开发团队说正在开发新的权限管理功能。

    • 主要内容有:

      • 超级用户有哪些权限,能够实现哪些功能。
      • 普通用户存在哪些权限。
  • CVAT中的Tasks和Jobs详解

  • 预训练模型相关详解(半自动标注)

    • 如何实现半自动标注。
    • 提供了哪些预训练模型。
    • 如果我们自己有模型,该如何导入使用。
  • 多人协作标注探索

    • 多人协作时,有哪些不同权限。
    • 分配、标注、审核等基本流程是啥,在哪里实现。
  • 标注过程详解(包括标注小技巧)

    • 根据标注任务,介绍基本标注流程。
    • 介绍快捷键的使用。
    • 介绍其他一些遇到的问题。
    • 包括输入导入形式。
  • 标注结果导入与导出

    • 标注结果导出形式是什么样的,要如何导出,还有哪些选项。
    • 如何导入已有的标注数据?

2. 官方文档整理与阅读

  • Installation guide,即安装文档。更多相关内容请参考本文的第三章。

    • 主要内容包括在Ubuntu 18.04/Win10/Mac上的基本安装流程。
    • 还有一些安装过程中的可选项:设置代理、半自动标注部署、停止所有container、设置自定义域名/IP、邮箱验证、共享硬盘等功能。
  • User’s guide,即用户手册

    • 这一部分内容最多了,只写一下包括哪些内容,更多信息在详细使用记录里面写。
    • Getting Started:入门教程,刚装好CVAT后要如何进行第一次标注,并介绍了半自动标注与搜索功能。
    • Interface of the annotation tool:简单介绍CVAT的界面,其本质就是介绍CVAT有的功能。
    • 介绍了CVAT中的几种模式,即 shape mode、track mode、attribute annotation mode。
    • 介绍了几种常见标注的方式以及基本操作流程,即annotation with rectangle by 4 points/polygons/polylines/points/cuboids/tags/polygons
    • 介绍了自动标注功能,即Automatic annotation。
    • 还有Shape Group(类似于组合)、Filter(过滤annotation)功能。
    • 介绍了所有可用的快捷键。这个非常有用,可以从头到尾看一遍。标注过程中,快捷键能够极大地提高效率。
  • XML annotation format:当从CVAT中下载标注结果的时候,很可能就是XML格式的。

  • Django REST API:部署后提供了一些api,不过我不太关心。

  • Datumaro dataset framework:数据集管理工具,好像有一些格式转换、质量检查等功能。

  • Command line interface:命令行工具,一个python脚本,提供了tasks管理、下载图片、下载annotations的功能。

  • AWS deployment Guide:AWS部署的注意事项

  • FAQ

  • Questions:如何提问

  • 3
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值