python-批量删除xml格式错误的图片和文件

        此脚本适用于标注出来的部分xml文件错误,错误内容是width 或hight为0。(好像是因为png格式图片有问题)。

import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join
import sys
class Logger(object):
    def __init__(self, filename="log.txt"):
        self.terminal = sys.stdout
        self.log = open(filename, "a")

    def write(self, message):
        self.terminal.write(message)
        self.log.write(message)

    def flush(self):
        pass
#path = os.path.abspath(os.path.dirname(__file__))
#type = sys.getfilesystemencoding()
#sys.stdout = Logger()

count = 0
xmllist = os.listdir("/home/easen/wyc/data/tmp/xmls/")
for file in xmllist:
    if os.path.splitext(file)[1] == ".xml":
        in_file = open("/home/easen/wyc/data/tmp/xmls/"+file)
        tree=ET.parse(in_file)
        root = tree.getroot()
        size = root.find('size')
        w = int(size.find('width').text)
        if w == 0 :
            print(file)
            in_file.close()
            os.remove("/home/easen/wyc/data/tmp/xmls/"+file)
            os.remove("/home/easen/wyc/data/tmp/imgs/"+os.path.splitext(file)[0]+".jpg")
            count +=1
print(count)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值