筛查多余的xml文件,不删除。

"""
使用说明:
    1、在两个path路径下填入地址,!!xml、jpg是两个独立的文件夹!!
    2、筛查出多余的xml并提示少xml,不删除。 用作剔除之后的检查工作
"""
import os
path1 = r'D:\Desktop\xin_all1239\jpg'  # 图片的地址
path2 = r'D:\Desktop\xin_all1239\xml'  # 对应标签的地址

def file_name(image_dir,xml_dir):
    jpg_list = []
    xml_list = []
    
    for root, dirs, files in os.walk(image_dir):  # 遍历Iamges 文件夹
        for file in files:
            jpg_list.append(os.path.splitext(file)[0])  # 将文件的名字剔除.jpg后添加在jpg_list[]的列表中
    print(jpg_list) #显示全部Images文件名,在一个列表下
    
    for root, dirs, files in os.walk(xml_dir):
        for file in files:
            xml_list.append(os.path.splitext(file)[0])
    print(xml_list) #显示全部label文件名,在一个列表下     
       
    print(len(jpg_list) )   # 显示有多少张图片 
    print("jpg" )
    
    print(len(xml_list) )  # 显示有多少张标签 
    print("xml" )

    #筛查出多余的xml并提示,不删除
    diff = set(xml_list).difference(set(jpg_list))  # 差集,在a中但不在b中的元素
    for name in diff:
        print("no xml", name + ".xml")

if __name__ == '__main__':

    file_name(path1,path2)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值