CSV多标签数据预处理+加上csv多标签转文件夹+ ISIC2018数据集分类预处理

在下小白,深感自己的代码能力太差劲的,真要是大佬,那不是分分钟写出代码;

我这个是准备跑分类网络,有些模型要求分类的数据集必须是文件夹那种类型已经分好了,我找到的是官网的数据集,没有进行数据预处理;

在我处理数据的时候,在网上搜索关于csv针对多标签处理的时候,发现我没找到好用的代码;

在综合好几个博主的代码放在这里,参考的太多了,没时间就不放了;

实测也可以运行

import pandas as pd
import os
import shutil  

# 读取表格文件+填写你的csv文件的位置
f = open(r"D:\PythonProject\dataset\ISIC2018_Task3_Training_GroundTruth.csv", "rb") 
list = pd.read_csv(f)

# 进行分类----填写你要分类文件夹的标签,有多少就写多少
for i in ['NV','DF','AKIEC','VASC','BKL','MEL','BCC']:
    if not os.path.exists(i):
        os.mkdir(i)
    listnew = list[list["type"] == i]#type是你csv文件里面的你要处理的那一列的列名称
    l = listnew["image"].tolist()#image这里是你的处理文件的名字的列名称
    j = str(i)
    for each in l:
        #这里是你数据文件放置的位置
        shutil.copy('D:\\PythonProject\\dataset\\ISIC2018_Task3_Training_Input\\images\\' + each, j)

在这里放上我的数据csv文件的处理的结果

未处理之前的结果: 

代码处理之后的结果

 

顺便把我使用的数据集链接放在这个地方,

 ISIC2018 是一个皮肤损伤数据集,包含 10,015 张图像和七个标签。每个图像都与其中一个标签相关联,形成一个多类分类问题

ISIC Challenge

我是挂tizi进去的,其他网络不清楚

 

 

  • 5
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 11
    评论
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值