要处理的.txt如下,举例:文件夹lululu下面包含两个子文件夹,每个子文件夹里包含若干个.txt,每个.txt里有几个特征,我要做的是批量读取这些文本文档,并将这些txt写入到一个新的txt里,并且在每类特征后加入类标签,以便后续处理。
代码如下:
import glob
import os
import tensorflow as tf
import numpy as np
path='../../datasets/lululu'
f ='../../datasets/file1.txt'
def read_writeFile(path,f):
cate=[path+'/'+x for x in os.listdir(path)]
f2 = open(f, 'a+')
for idx,folder in enumerate(cate):
for im in glob.glob(folder+'/*.jpg.txt'):
f1 = open(im, 'r')
for eachLine in f1:
f2.write(eachLine)
f2.write(' '+str(idx+1)+'\n')
f1.close()
read_writeFile(path,f)
最后得到的.txt 如下。