数据集处理
积分_
这个作者很懒,什么都没留下…
展开
-
006_切割图片根据xml
# 切割图片 按名称切割放入文件夹```pythonimport xml.etree.ElementTree as ETimport cv2import osfrom lxml import etreefrom tqdm import tqdmclass GEN_Annotations: def __init__(self, filename): self.root = etree.Element("annotation") child1 = et原创 2021-03-01 18:46:21 · 448 阅读 · 0 评论 -
005_根据时间更改图片和xml的名字
import timeimport osfrom tqdm import tqdmyear = time.localtime().tm_yearmonth = time.localtime().tm_monday = time.localtime().tm_mdayhour = time.localtime().tm_hourminute = time.localtime().tm_minsecond = time.localtime().tm_sec# jpg#flag = 1原创 2021-01-28 11:41:34 · 85 阅读 · 0 评论 -
004_查找xml中size为0的
# coding:utf-8import osimport os.pathimport xml.dom.minidomimport shutilpath = r'D:\03_data\Annotations'path_after = r'D:\03_date\03_data\ann_1'# path="../xml/"files = os.listdir(path) # 得到文件夹下所有文件名称s = []for xmlFile in files: # 遍历文件夹 i原创 2021-01-28 11:36:55 · 353 阅读 · 3 评论 -
002_根据像素查找相同的照片
import os, time, hashlibimport shutil#根据图片像素去重def getmd5(file): if not os.path.isfile(file): return fd = open(file, 'rb') md5 = hashlib.md5() md5.update(fd.read()) fd.close() return md5.hexdigest()if __name__ == "__mai原创 2021-01-27 16:37:32 · 182 阅读 · 0 评论 -
003_xml中出现浮点数变为整数
# *_* coding : UTF-8 *_*import osimport xml.etree.ElementTree as ETpath = r'D:\03_date_work\ann' # 包含xml的文件夹路径def edit_xml(xml_file): """ 修改xml文件 :param xml_file:xml文件的路径 :return: """ all_xml_file = os.path.join(path, xml原创 2021-01-27 16:42:32 · 367 阅读 · 1 评论 -
001_ 根据图片划分数据集
001_ 根据图片划分数据集在进行操作之前的数据处理阶段import osimport randomimport shutil# 二分类 BASE_DIR = r"D:\03_date_work\05_huxiqi\03_shangchuan\03_data"# BASE_DIR = "02_shangchuan\\"# BASE_DIR = "hangchuang"def makedir(new_dir): if not os.path.exists(new_dir):原创 2021-01-27 16:34:18 · 315 阅读 · 1 评论