数据处理
黄小黄i
一个双鱼座的程序猿
展开
-
对比两个文件夹保留相同文件
img_path = ‘G:/cervical_cancer/data/roi/aug_roi_based_data_generation/train/’label_path = ‘G:/cervical_cancer/data/roi/aug_roi_based_data_generation/label/’dirpath = os.listdir(img_path)for image in dirpath:image_name = image.split(".")[0]if image.spl原创 2020-11-25 13:41:02 · 829 阅读 · 0 评论 -
coco数据集
一、coco数据集字段1、info字段:包括一下字段2、licenses:里面集合了不同类型的licenses,并在images中按照id号被应用,基本不参与数据解析的过程中。3、images:对应每张图片的详细信息,其中的id号是分配的唯一id4、categories:其中supercategory是父类,name是子类,id是类别id(按照子类统计)5:annotation:category_id:该注释的类别idid:当前注释的idimage_id:该注释所在的图片的id号a原创 2020-11-06 15:37:05 · 990 阅读 · 0 评论 -
统计文件夹下所有文件的文件名到txt文件中
自己制作数据集,一个类别的图片标记完了需要做成一个train.txt,包含所有的训练图片的名称,怎么实现呢?1、在包含训练图片的文件夹中新建TXT文件。2、在TXT文件中输入 DIR ./B>train.txt (DIR命令后须有一空格)3、保存后将后缀名改为BAT。4、双击该文件即可生成一个train.txt。5、打开再根据自己要求修改即可。说明此方法只使用于Windows系统,且在按照上述方法的处理结果中包含文件名的后缀,如果想要去除文件名的后缀可以在txt文件中可以利用查找替换的原创 2020-10-28 11:53:04 · 982 阅读 · 0 评论