对数据集的处理需要我们把数据做成label,并且生成txt,保存文件名,因为训练的时候是根据txt去找原文件的。之前已经写好了,但是不小心删了,之前觉得简单,没写博客,写一下方便以后用。
import os
def convert2txt(source, output):
# open(output, "w")
files = os.listdir(source)
# print(files) # ['1.jpeg', '2.jpeg']
for file in files:
print(file)
filename, extension = os.path.splitext(file)
# print(filename)
# print(extension) # 包括了点
fullname = os.path.join(source, filename)
# print(fullname)
output.write(fullname+"\n")
if __name__ == '__main__':
sourcefile = "F:\\视频目标检测\\MEGA\\test"
out = open("F:\\视频目标检测\\MEGA\\mega.pytorch\\datasets\\test.txt", "w")
convert2txt(sourcefile, out)
需要在主函数中打开,在函数中打开,会报错。
注意打开时候要指定模式。