Part1:将多个文件夹中的.features文件整合在一个txt文件中
背景:该数据集大文件夹包含六个小文件夹,每个小文件夹代表一个类别,其中包含该类别下图片特征的文件,文件原格式无法用python直接打开,所以在读取前需要一步修改文件后缀的步骤。每个单独的文件内容有六行,是提取的各种特征向量,首先尝试将这六个特征向量作为一个特征向量,所以需要把单独文件中的回车符号去掉,以逗号代替,最后在整个文件的数据后(即一个完整的特征向量后)写入回车符,以方便后面对特征文件的进一步处理。
import os
for filename in os.listdir("kvasir-dataset-v2-features"):
for filename2 in os.listdir("kvasir-dataset-v2-features/" + filename):
portion = os.path.splitext(filename2) # 分离文件名与扩展名
if portion[1] == '.features':
# 重新组合文件名和后缀名
newname = portion[0] + '.txt'
os.chdir("kvasir-dataset-v2-features/" + filename)#切换路径
os.rename(filename2, newname)
filename2