YOLO训练自己的数据
参考:https://blog.csdn.net/Creama_/article/details/106209388
辅助参考:https://my.oschina.net/u/4321806/blog/4470154
https://blog.csdn.net/weixin_44771532/article/details/105495755
https://zhuanlan.zhihu.com/p/138791419
文件存放位置:
xml文件转移
首先是将jpg文件和xml文件统一进行重命名并且一一对应,此过程在win系统进行
import numpy as np
import glob
import os
import xml.etree.ElementTree as ET
import xml.dom.minidom
'''
第一步,将xml文件和图片重新命名
'''
# 获取文件夹中bmp图片的数量
def getDirImageNum(path):
bmpDirImagesNum = 0
for bmpfile in os.listdir(path):
if os.path.splitext(bmpfile)[1] == '.jpg':
bmpDirImagesNum += 1
return bmpDirImagesNum
# 获取文件夹中xml文件的数量
def getDirXmlNum(path):
xmlDirXmlNum = 0
for xmlfile in os.listdir(path):
if os.path.splitext(xmlfile)[1] == '.xml':
xmlDirXmlNum += 1
return xmlDirXmlNum
inputpath1="E:\\VOC2007\\j\\"
inputpath2="E:\\VOC2007\\a\\"
outpath1="E:\\VOC2007\\JPEGImages\\"
outpath2="E:\\VOC2007\\Annotations\\"
file_name = os.listdir(inputpath2)
error = []
for item in file_name:
print(item)
o_imap = inputpath1+item.split('.')[0]+".jpg"
o_xmlp = inputpath2+item.split('.')[0]+".xml"
i = getDirImageNum(outpath1) # 表示bmp文件的命名是从当前输出文件夹中的bmp文件数目开始的
if os.path.exists(o_imap) and os.path.exists(o_xmlp):
i = i+1
new_name = '0' + format(str(i), '0>5s') + '.jpg'
dst1 = os.path.join(os.path.abspath(outpath1), new_name) # 为000001.jpg
os.rename(o_imap, dst1)
dst2 = os.path.join(os.path.abspath(outpath2), '0' + format(str(i), '0>5s') + '.xml') # 为000000.xml形式,想要的格式
try:
dom = xml.dom.minidom.parse(o_xmlp)
root = dom.documentElement
# 获取标签对path之间的值并赋予新值j
# 文件夹赋值
root.getElementsByTagName('folder')[0].firstChild.data = "VOC2007"
# 获取标签对filename之间的值并赋予新值j
root.getElementsByTagName('filename')[0].firstChild.data = new_name
# 将修改后的xml文件保存,xml文件修改前后的路径
# 打开并写入
with open(o_xmlp, 'w') as fh:
dom.writexml(fh)
os.rename(o_xmlp, dst2)
print ('converting %s to %s ...' % (o_xmlp, dst2))
except:
error.append(new_name)
continue
# 如果有出错的文件,error++
print(len(error))
接下来复制到linux系统中,修改xml文件的路径和名称,名称应该不用该
# 改路径
'''import xml.dom.minidom
import os
path='/home/lsc/fire_detect/data/voc/VOCdevkit/VOC2007/Annotations1' # xml文件存放路径
sv_path='/home/lsc/fire_detect/data/voc/VOCdevkit/VOC2007/Annotations' # 修改后的xml文件存放路径
files=os.listdir(path)
for xmlFile in files:
dom=xml.dom.minidom.parse(os.path.join(path,xmlFile)) #打开xml文件,送到dom解析
root=dom.documentElement #得到文档元素对象
item=root.getElementsByTagName('path') #获取path这一node名字及相关属性值
for i in item:
i.firstChild.data='/home/lsc/fire_detect/data/voc/VOCdevkit/VOC2007/JPEGImages' #xml文件对应的图片路径
with open(os.path.join(sv_path,xmlFile),'w') as fh:
dom.writexml(fh)
'''
# 改filename
import xml.dom.minidom
import os
path='/home/lsc/fire_detect/data/voc/VOCdevkit/VOC2007/Annotations1' # xml文件存放路径
sv_path='/home/lsc/fire_detect/data/voc/VOCdevkit/VOC2007/Annotations' # 修改后的xml文件存放路径
files=os.listdir(path)
for xmlFile in files:
dom=xml.dom.minidom.parse(os.path.join(path,xmlFile)) #打开xml文件,送到dom解析
root=dom.documentElement #得到文档元素对象
item=root.getElementsByTagName('path') #获取path这一node名字及相关属性值
a,b=os.path.splitext(xmlFile) #分离出文件名a
for i in item:
i.firstChild.data=a + '.jpg'
with open(os.path.join(sv_path,xmlFile),'w') as fh:
dom.writexml(fh)