coco 数据集的理解与制作

最近把ctw的数据集转换为coco的数据集,过程很痛苦但是对coco的数据集以及CTW的数据集有了些了解

CTW的数据集结构请参考:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/

coco数据集的结构是外层一个很大的字典,包含了information, categories, annotations, images ,license等。通过对coco api代码的阅读,训练模型用到的只有categories, annotations, images 三个key对应的value.

coco的数据集每个key对应的值都为list,list中的每个元素又是一个字典。

首先分析下images, images-->list-->dict,在底部的dict需要包含的key有,width,height,file_name, id,这里的id是图片对应的id,通过id,annotations可以找到相对应的图片

然后是categories, categories-->list--> dict, 这里如果你自己没有supercategories并不要紧,你只需要确保自己底层的dict包含有 id和name两个key

最复杂的是annotations, annotation-->list -->dict,这里底部的dict 需要的key比较多, area:float/int, iscrowd: 0/1(iscrowd=0,将使用polygons格式)还是一组对象(即iscrowd=1,将使用RLE格式), image_id:int(这里对应的是images里面的id),  bbox: [ ](minx,miny,w,h) category_id:int , id:int(这里的id值得是annotations的id,是独一无二的即可), segmentation:[ [ ] ] (注意这里,必须是list 包含list,底层的list中必须有至少6个元素,否则coco api会过滤掉这个annotations,也就是说你必须用至少三个点来表达一块。外层的list的长度取决于一个完整的物体是否被分割成了数块,比如一个物体苹果没有任何的遮挡,则外部的List长度就为1)

具体的代码参考请详见: https://github.com/ycAlex11/coco_dataset_convert

caffe,caffe2, tensorflow 小白,代码有些low,刚开始工作,望大家多多指教

  

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值