将标签文件转换为不同的数字
说明
通过网上下载的数据,可能是单标签的, 所以都是0
如果有三个类, 则需要转换成0, 1, 2
下面代码可以将labels 的所有数据转成你想要的label
import os
origin_path = "/media/cdm/1192cd9d-1c95-4fb6-9c22-2775a466b354/cdm/dataset/tankers/"
list_path = ["train", "valid", "test"]
def first_line(file):
first_line = file.readline() # 读取第一行内容
words = first_line.split() # 将第一行拆分成单词列表
words[0] = label # 将第一个单词(即第一个数字)替换为1
new_first_line = " ".join(words) + "\n" # 将单词列表重新组合成一行文本并添加换行符
file.seek(0) # 将文件指针移动到文件开头
file.write(new_first_line) # 将修改后的第一行写入文件中
file.truncate() # 截断文件尾,防止可能出现的文本溢出
def all_lines(file):
lines = file.readlines() # 读取文件的所有文本行
file.seek(0) # 将文件指针移动到文件开头
for line in lines: # 循环遍历文件的每一行
words = line.split() # 将每一行拆分成单词列表
words[0] = label# 将第一个单词(即第一个数字)替换为1
new_line = " ".join(words) + "\n" # 将单词列表重新组合成一行文本
file.write(new_line) # 将修改后的文本行写入文件中
file.truncate() # 截断文件尾,防止可能出现的文本溢出
label = "3"
for item in list_path:
purpose = origin_path + item + "/labels"
if not os.path.isdir(purpose):
continue
for i in os.listdir(purpose):
if i.endswith(".txt"): # 如果是.txt文件
filepath = os.path.join(purpose, i) # 获取该文件的完整路径
print(filepath)
with open(filepath, "r+") as file: # 以读写模式打开该文件
first_line(file)