标签工具VOTT的使用笔记
微软推出了一款标签工具VOTT,它是一款能标记图像或视频帧的工具。
具体说明请参考github。
一.安装方法
- 使用git和npm下载(node.js>10.x)
git clone https://github.com/Microsoft/VoTT.git
cd VoTT
npm ci
npm start
- 直接下载安装(个人推荐)
如果尝试第一种安装方法好几次都出错,那么可以尝试第二种方式。访问 https://github.com/Microsoft/VoTT/releases下载相应的文件。
Example:Windows用户可以直接下载vott-2.1.0-win32.exe。
二.使用方法
- 打开VOTT,新建项目
- 编写项目设置
编写项目名称
点击Add connection
此处需要建立两个connection,一个是输入的路径(source connection),一个是输出的路径(target connection)。
在provider里选择Local File System,并选择你需要标记的照片或视频的路径。同理,再新建add一个connection,选择你想输出结果的路径。选择完后 按保存即可。
如果标记的是照片,那就忽略下面的video settings(设置帧数)。
最后写tags,记得输入后需要按Enter才能保存! - 使用方法
定位标签对象(快捷键R为矩形,P为不规则形状),然后点击右边的tags(快捷键为输入tags对应的数字)。如果一个对象有多个tag,不需要重新再画矩形,只需要在相同的矩形上点击另一个tag。如果照片有多个对象,就需要重新画矩形。
快捷键:
- Ctrl or Cmd + C - copy
- Ctrl or Cmd + X - cut
- Ctrl or Cmd + V - paste
- Ctrl or Cmd + A - select all
- Ctrl or Cmd + Z - undo
- Ctrl or Cmd + Shift + Z - redo
- S 下一张照片
- 0 - 9为tags的快捷键
提示:点击右上角的锁?,可以锁定每次新建框的类别
三.结果查看
结果以json格式保存在输出路径里面。文件名称为xxxxxx-asset.json
在regions.tags里面能看到你写入的标签.
{
"asset": {
"format": "png",
"id": "0a66e4ab3df339ece71561f558d0b1c1",
"name": "1.png",
"path": "file:E:/Data/1.png",
"size": {
"width": 432,
"height": 288
},
"state": 2,
"type": 1
},
"regions": [
{
"id": "uZlfu4ZGX",
"type": "RECTANGLE",
"tags": [
"happy"
],
"boundingBox": {
"height": 191.68778582317074,
"width": 168.1128247555945,
"left": 129.3656467210104,
"top": 53.492687690548784
},
"points": [
{
"x": 129.3656467210104,
"y": 53.492687690548784
},
{
"x": 297.47847147660485,
"y": 53.492687690548784
},
{
"x": 297.47847147660485,
"y": 245.18047351371953
},
{
"x": 129.3656467210104,
"y": 245.18047351371953
}
]
}
],
"version": "2.1.0"
}
四,其他
- 团队合作
VOTT还支持上传到云端的功能,方便团队的合作。还可以访问VOTT网页版走到哪,标到哪… - Activing learning功能
一个能自动定位画框的功能。