图像文件与标注文件一一配对

最新推荐文章于 2023-03-08 17:21:22 发布

CV界的文盲

最新推荐文章于 2023-03-08 17:21:22 发布

阅读量866

点赞数 2

分类专栏：计算机视觉文章标签： transformer 深度学习人工智能

本文链接：https://blog.csdn.net/dongjiuqing/article/details/121647731

版权

计算机视觉专栏收录该内容

22 篇文章 0 订阅

订阅专栏

情况：使用labelimg标注文档后，获得了大量的图片数据和标注数据。且图像名称与标注名称相同，只是后缀不同。但中间经过一些不为人所知的事情发生后，有些图像数据缺失了标注数据，有些标注数据对应的图像数据找不到了。我们需要对图像文件与标注文件1:1的关系配对。

该代码写的时候，具体情况是图像数据有4000张，标注数据有6000张，且4000张图像数据均有标签。因此我直接用了图像的文件名进行匹配。删除了多余的标签。

import os
from shutil import copy

image_path = '/Users/Dong/Desktop/test/dataset_org/train'
xml_path = '/Users/Dong/Desktop/test/dataset_org/train_xml'

img_list = []
xml_list = []
# 保存所有的图像名
for root, dirs, files in os.walk(image_path):
    for file in files:
        filename = file[:-4]
        img_list.append(filename)

# 保存所有的标签名
for root, dirs, files in os.walk(xml_path):
    for file in files:
        filename = file[:-4]
        xml_list.append(filename)

print(len(img_list))
print(len(xml_list))

# 因为我的情况是每个图像都有标签，而有些标签的图像没了。
# 因此我遍历所有的标签名，如果能和图像名对应不上，那么就删除这个标签。相反您也可以拿同样的方法去删除图像。
for i in xml_list:
    if i not in img_list:
        xml_path_abs = os.path.join(xml_path, i) + '.xml'
        os.remove(xml_path_abs)

CV界的文盲

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
1
评论
图像文件与标注文件一一配对

情况：使用labelimg标注文档后，获得了大量的图片数据和标注数据。且图像名称与标注名称相同，只是后缀不同。但中间经过一些不为人所知的事情发生后，有些图像数据缺失了标注数据，有些标注数据对应的图像数据找不到了。我们需要对图像文件与标注文件1:1的关系配对。该代码写的时候，具体情况是图像数据有4000张，标注数据有6000张，且4000张图像数据均有标签。因此我直接用了图像的文件名进行匹配。删除了多余的标签。import osfrom shutil import copyimage_path =
复制链接

扫一扫