此篇文章会不断补充内容,建议长期关注。最后更新日期为2018年11月25日。
需要用到的工具:
UltraEdit
Git
Python ,包含 jupyter notebook,以及其它必要的包
Adobe Photoshop CC
目前官方 API 只提供了 Lua 脚本、Python 脚本和 Matlab 脚本的编程接口,暂时没有适配 .net 框架的接口。其中只有 Matlab 脚本才能使用 analyze() 函数对评估结果进行分析。
coco 数据集有五种标注类型,分别是“目标检测”、“关键点检测”、“素材分割”、“全景分割”和“图像说明”。标注信息使用 JSON 格式存储。请注意,下载页面上描述的 COCO API 可用于访问和操作所有“标注”。 所有“标注”都具有下面相同的基本数据结构:
{
"info" : info,
"images" : [image],
"annotations" : [annotation],
"licenses" : [license],
}
info{
"year" : int,
"version" : str,
"description" : str,
"contributor" : str,
"url" : str,
"date_created" : datetime,
}
image{
"id" : int,
"width" : int,
"height" : int,
"file_name" : str,
"license" : int,
"flickr_url" : str,
"coco_url" : str,
"date_captured" : datetime,
}
license{
"id" : int,
"name" : str,
"url" : str,
}
接下来只描述“对象检测”的特定格式:
一、对象检测
每个对象实例的标注都包含一系列字段,包括对象的类别ID(category_id)和分段掩码(segmentation)。 分段格式取决于实例是表示单个对象(iscrowd = 0,在这种情况下使用多边形)还是对象集合(iscrowd = 1,在这种情况下使用RLE)。 请注意,单个对象(iscrowd = 0)可能需要多个多边形,例如,如果被遮挡。 人群注释(iscrowd = 1)用于标记大组对象(例如一群人)。 此外,为每个对象提供一个封闭的边界框(框坐标是从左上角的图像角测量的,并且是0索引的)。 最后,标注结构的 categories 字段存储 category id 到 category 和 supercategory 名称的映射。 另请参阅检测任务。
annotation{