这篇文章提供了一个比较好的思路。总体做法还是离不开这个文章的做法。
上面文章作者提供的思路比较正统开始说明之前我们先说明一下coco2017的格式类型,这些网络上也说了很多了,这里再提及一下加深理解。
coco/
annotations/
instances_train2017.json
instances_val2017.json
images/
train2017/
0d4c5e4f-fc3c-4d5a-906c-105.jpg
val2017
0ddfc5aea-fcdac-421-92dad-144.jpg
以上格式摘自上面提到的文章,并且最后我们也是按这种方式生成的。
这里我们用到的格式也可以这么做,当然也可以适配自己的文件,比如要是每个视频下拆除的单张图,那么可以再多加一级目录出来。
具体的做法按照启发写到我的github项目里了,这里简要说明一下,当然github上后续也会更新。
csv格式制作
这里用csv也可以,用txt也可以,数据的格式并不是一个问题,而如何转换到我们想要的格式则有多种解决方式。
这里只展示csv的用法。
import os
import json
import cv2
import time
import argparse
import csv
parser = argparse.ArgumentParser(description='convert object label')
parser.add_argument('data', metavar='DIR',
help='path to dataset')
parser.add_argument('keyframe_dir', metavar='DIR',
help='path to frame dir')
parser.add_argument('--mode', type=str, choices=['train', 'val', 'test'])
args = parser.parse_args()
root = os.path.join(args.data, args.mode)
video_list = open(os.path.join(root, 'videolist.txt'),'r')
output_list = open('%s_list.txt' % args.mode,'w')
obj_name = open('objects_en.txt','r')
obj_list = [line.rstrip() for line in obj_name]
print(obj_list)
train_category = []
video_count = 0
start = time.time()
key_frame_count = 0
#output_folder = '%s_label' % args.mode
#if not os.path.exists(output_folder):
# os.makedirs(output_folder)
with open('val.csv','w') as f1:
for vid in video_list:
label = json.load(open(os.path.join(root, 'label', 'sample_' + vid.rstrip().split('.')[0] + '.json'), 'r'))