背景
下面的代码是将INRIA数据集转换成VOC格式。图片是614张。
其中,使用OinginImage文件夹里的Train中Pos和Annotations作为训练,利用Test里的Pos作为测试。
# -*- coding: UTF-8 -*-
from xml.dom.minidom import Document
import os
import re
list = os.listdir("annotations")
savePath = 'Annotations'
for oldfilename in list:
if str(".txt") not in oldfilename:
continue
print oldfilename
#raw_input(unicode('按回车键退出...','utf-8').encode('gbk'))
fileindex = re.findall('\d+', oldfilename)
print fileindex
#raw_input(unicode('按回车键退出...','utf-8').encode('gbk'))
print str(int(fileindex[0]))
#raw_input(unicode('按回车键退出...','utf-8').encode('gbk'))
newfilename = os.path.splitext(oldfilename)[