将标签文件转换为不同的数字

最新推荐文章于 2024-08-08 14:28:23 发布

东哥爱编程

最新推荐文章于 2024-08-08 14:28:23 发布

阅读量178

点赞数

分类专栏： ubuntu python 文章标签： python 开发语言

本文链接：https://blog.csdn.net/monk96/article/details/130529583

版权

python 同时被 2 个专栏收录

50 篇文章 2 订阅

订阅专栏

ubuntu

11 篇文章 0 订阅

订阅专栏

将标签文件转换为不同的数字

说明

通过网上下载的数据，可能是单标签的，所以都是0
如果有三个类，则需要转换成0, 1, 2

下面代码可以将labels 的所有数据转成你想要的label

import os

origin_path = "/media/cdm/1192cd9d-1c95-4fb6-9c22-2775a466b354/cdm/dataset/tankers/"
list_path = ["train", "valid", "test"]



def first_line(file):
    first_line = file.readline()  # 读取第一行内容
    words = first_line.split()  # 将第一行拆分成单词列表
    words[0] = label  # 将第一个单词（即第一个数字）替换为1
    new_first_line = " ".join(words) + "\n"  # 将单词列表重新组合成一行文本并添加换行符
    file.seek(0)  # 将文件指针移动到文件开头
    file.write(new_first_line)  # 将修改后的第一行写入文件中
    file.truncate()  # 截断文件尾，防止可能出现的文本溢出
def all_lines(file):
    lines = file.readlines() # 读取文件的所有文本行
    file.seek(0) # 将文件指针移动到文件开头
    for line in lines: # 循环遍历文件的每一行
        words = line.split() # 将每一行拆分成单词列表
        words[0] =  label# 将第一个单词（即第一个数字）替换为1
        new_line = " ".join(words) + "\n" # 将单词列表重新组合成一行文本
        file.write(new_line) # 将修改后的文本行写入文件中
        file.truncate() # 截断文件尾，防止可能出现的文本溢出                      
        
label = "3"
for item in list_path:
    purpose = origin_path + item + "/labels"
    if not os.path.isdir(purpose):
        continue
    for i in os.listdir(purpose):
        if i.endswith(".txt"): # 如果是.txt文件
            filepath = os.path.join(purpose, i) # 获取该文件的完整路径
            print(filepath)
            with open(filepath, "r+") as file: # 以读写模式打开该文件
                first_line(file)