coco 数据集的理解与制作

最新推荐文章于 2024-08-08 07:20:16 发布

qq_39678788

最新推荐文章于 2024-08-08 07:20:16 发布

阅读量5.6k

点赞数 1

文章标签： Mask_RCNN

本文链接：https://blog.csdn.net/qq_39678788/article/details/80198680

版权

最近把ctw的数据集转换为coco的数据集，过程很痛苦但是对coco的数据集以及CTW的数据集有了些了解

CTW的数据集结构请参考：https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/

coco数据集的结构是外层一个很大的字典，包含了information, categories, annotations, images ,license等。通过对coco api代码的阅读，训练模型用到的只有categories, annotations, images 三个key对应的value.

coco的数据集每个key对应的值都为list，list中的每个元素又是一个字典。

首先分析下images, images-->list-->dict，在底部的dict需要包含的key有，width，height，file_name, id,这里的id是图片对应的id，通过id，annotations可以找到相对应的图片

然后是categories， categories-->list--> dict，这里如果你自己没有supercategories并不要紧，你只需要确保自己底层的dict包含有 id和name两个key

最复杂的是annotations, annotation-->list -->dict，这里底部的dict 需要的key比较多， area:float/int, iscrowd: 0/1(iscrowd=0，将使用polygons格式）还是一组对象（即iscrowd=1，将使用RLE格式), image_id:int(这里对应的是images里面的id), bbox: [ ]（minx,miny,w,h) category_id:int , id:int(这里的id值得是annotations的id，是独一无二的即可）， segmentation:[ [ ] ] (注意这里，必须是list 包含list，底层的list中必须有至少6个元素，否则coco api会过滤掉这个annotations,也就是说你必须用至少三个点来表达一块。外层的list的长度取决于一个完整的物体是否被分割成了数块，比如一个物体苹果没有任何的遮挡，则外部的List长度就为1)

具体的代码参考请详见： https://github.com/ycAlex11/coco_dataset_convert

caffe,caffe2, tensorflow 小白，代码有些low,刚开始工作，望大家多多指教