PASCAL 视觉对象类挑战 2007,2011 (VOC2007, 2011) 注释指南
本文档复制了 VOC2007 数据集中用于注释图像的指南。
一, 关于标签内容和方式的指南
标注什么
定义类别的所有对象,除非:
- 你不确定对象是什么。
- 对象非常小(由您自行决定)。
- 不到 10-20% 的物体是可见的。
如果由于对象太多而无法做到这一点,请将图像标记为不良。
视点 Viewpoint
记录物体“大块”的视点,例如身体而不是头部。允许 10-20 度范围内的视点。
如果不明确,请保留为“未指定Unspecified”。
边界框 Bounding box
标记对象可见区域的边界框(不是对象的估计总范围)。
边界框应包含所有可见像素,除非边界框必须做得过大以包含一些额外的像素(<5%),例如汽车天线。
遮挡/截断 Occlusion/ truncation
如果超过 15-20% 的对象被遮挡并位于边界框之外,则标记为“截断”。
如果遮挡区域位于边界框内,则不要标记为截断。
图像质量/照明 Image quality/ illumination
质量差的图像(例如过度运动模糊)应标记为差。然而,照明不佳(例如轮廓中的物体)不应算作质量差,除非无法识别物体。
由多个图像组成的图像(例如拼贴画)。
衣服/泥/雪等
如果一个物体被一个紧密配合的遮挡物“遮挡”,例如衣服、泥土、雪等,则应将遮挡物视为对象的一部分。
透明度
标记透过玻璃可见的物体,但将玻璃上的反射视为遮挡。
镜子
在镜子中标记物体。
图片
仅当图片/海报/标志中的对象具有照片级真实感时才标记对象,但如果是卡通、符号等则不标记。
二, 分类指南
飞机
包括滑翔机但不包括悬挂式滑翔机
自行车
包括三轮车、独轮车
船
船、划艇、脚踏船,但不包括摩托艇
瓶子
塑料、玻璃或奶瓶
公共汽车
包括小巴
车
包括汽车、货车、载人交通工具等。
不要在仅显示车辆内部的地方贴上标签。
猫
家猫(不是狮子等)
椅子
包括扶手椅,但不包括凳子或长凳
餐桌
不包括咖啡桌或野餐凳
狗
家犬(不是狼等)
马
包括小马、驴、骡子等。
摩托车
包括轻便摩托车、踏板车、边车
盆栽
室内植物或室外植物清楚地放在花盆里。不包括花瓶里的花
沙发
不包括作为沙发床的沙发
火车
包括火车车厢,不包括电车
电视/显示器
独立屏幕(不是笔记本电脑),不是广告显示器
三, 分割指南
分割什么
边界框已根据上述准则标记的对象。
您可能需要排除包含在边界框中的背包、手提包等。
准确性
在 5 个像素内进行分割。标记的像素必须是对象;5 像素边界区域之外的像素必须是背景。边界像素可以是任何一个。
使用分割工具显示的tri-map来确保这些约束保持不变。
这有时可能涉及在边界框外标记像素。
混合像素
混合的像素,例如由于透明度,运动模糊或边界的存在应该被认为属于颜色对混合贡献最大的对象。
薄结构
旨在在精度限制内尽可能捕获薄结构。可以忽略大约一个像素厚度的结构,例如电线,索具,胡须。
桌子上的物品等。
如果许多小物体遮挡了一个物体,例如餐桌上的餐具/银器,它们可以被认为是该物体的一部分。
例外情况是,如果它们伸出对象(例如蜡烛),它们应该在对象边界处被截断。
困难的图像
过于难以分割到所需精度的图像可以不标记,例如一堆自行车。