将标签文件转换为不同的数字

将标签文件转换为不同的数字

说明

通过网上下载的数据,可能是单标签的, 所以都是0
如果有三个类, 则需要转换成0, 1, 2

下面代码可以将labels 的所有数据转成你想要的label

import os

origin_path = "/media/cdm/1192cd9d-1c95-4fb6-9c22-2775a466b354/cdm/dataset/tankers/"
list_path = ["train", "valid", "test"]



def first_line(file):
    first_line = file.readline()  # 读取第一行内容
    words = first_line.split()  # 将第一行拆分成单词列表
    words[0] = label  # 将第一个单词(即第一个数字)替换为1
    new_first_line = " ".join(words) + "\n"  # 将单词列表重新组合成一行文本并添加换行符
    file.seek(0)  # 将文件指针移动到文件开头
    file.write(new_first_line)  # 将修改后的第一行写入文件中
    file.truncate()  # 截断文件尾,防止可能出现的文本溢出
def all_lines(file):
    lines = file.readlines() # 读取文件的所有文本行
    file.seek(0) # 将文件指针移动到文件开头
    for line in lines: # 循环遍历文件的每一行
        words = line.split() # 将每一行拆分成单词列表
        words[0] =  label# 将第一个单词(即第一个数字)替换为1
        new_line = " ".join(words) + "\n" # 将单词列表重新组合成一行文本
        file.write(new_line) # 将修改后的文本行写入文件中
        file.truncate() # 截断文件尾,防止可能出现的文本溢出                      
        
label = "3"
for item in list_path:
    purpose = origin_path + item + "/labels"
    if not os.path.isdir(purpose):
        continue
    for i in os.listdir(purpose):
        if i.endswith(".txt"): # 如果是.txt文件
            filepath = os.path.join(purpose, i) # 获取该文件的完整路径
            print(filepath)
            with open(filepath, "r+") as file: # 以读写模式打开该文件
                first_line(file)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
您可以使用sklearn库中的LabelEncoder和OneHotEncoder来实现这个功能。具体步骤如下: 1. 使用pandas的read_csv函数读取csv文件,将其存储为一个DataFrame对象。 2. 导入LabelEncoder和OneHotEncoder,并实例化这两个对象。 3. 使用LabelEncoder的fit_transform函数将每个不同的英文标签替换成不同数字。 4. 使用OneHotEncoder的fit_transform函数将数字编码转换成独热编码。 5. 将转换后的数据保存到新的csv文件中,可以使用pandas的to_csv函数。 下面是一个示例代码: ```python import pandas as pd from sklearn.preprocessing import LabelEncoder, OneHotEncoder # 读取csv文件 df = pd.read_csv('your_file.csv') # 实例化LabelEncoder和OneHotEncoder le = LabelEncoder() ohe = OneHotEncoder() # 将英文标签替换成数字 df['label'] = le.fit_transform(df['label']) # 将数字编码转换成独热编码 label_encoded = ohe.fit_transform(df['label'].values.reshape(-1, 1)).toarray() # 将独热编码添加到原数据中 df_encoded = pd.concat([df, pd.DataFrame(label_encoded)], axis=1) # 将转换后的数据保存到新的csv文件中 df_encoded.to_csv('new_file.csv', index=False) ``` 其中,fit_transform函数分别用于拟合数据并进行转换。LabelEncoder用于将英文标签替换成数字,OneHotEncoder用于将数字编码转换成独热编码。需要注意的是,OneHotEncoder的输入需要是二维数组,因此需要使用reshape函数将一维数组转换成二维数组。最后,使用concat函数将独热编码添加到原数据中,再使用to_csv函数保存到新的csv文件中。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

东哥爱编程

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值