在做数据清洗的时候,会遇到一部分数据会用到,一部分数据需丢弃的情况,可以做一个字符串筛选器,完成自动化操作
'''
delete part jpg and xml
'''
# 同时删除了以region结尾的jpg和xml文件
import os
def del_files(path):
for root , dirs, files in os.walk(path):
for name in files:
if name.endswith("region.xml"): # 指定要删除的格式,这里是xml 可以换成其他格式
os.remove(os.path.join(root, name))
print ("Delete File: " + os.path.join(root, name))
elif name.endswith("region.jpg"): # 指定要删除的格式,这里是jpg 可以换成其他格式
os.remove(os.path.join(root, name))
print("Delete File: " + os.path.join(root, name))
# test
if __name__ == "__main__":
path = 'data/dataset/xxx/naru_region_data/'
del_files(path)