深度学习图像分类数据处理
文章平均质量分 51
查无此人☞
这个作者很懒,什么都没留下…
展开
-
ImageFolder、DataLoader加载CUB200数据集
只要给定每一类图像所在的文件夹的路径,即可完成全部的图片的加载:例如:但是问题是,如何划分训练集、测试集呢,使他们分别被加载!代码如下。主要思想就是根据官方提供的数据集划分方式,使用shutil.copyfile()函数把训练集、测试集分别拷贝到不同的目录下!import osimport numpy as np import shutil# divivd dataset (without annotations)img_dir = 'data/birds/'save_dir = 'd原创 2021-04-14 19:30:04 · 630 阅读 · 2 评论 -
Counter()函数进行排序后如何得到有序的键
当得到Counter()函数得到的排序结果后,如何得到有序的键呢?你在这里可以得到答案!下面以深度学习图像分类问题引入Counter()函数,假设现在有一个文件,记录了最后迭代的五次、在测试集上预测错误的图片的信息,现在要统计每一张预测错误的图片在这五次迭代中总共预测错误的次数、以及预测成错误的类别对应的次数。例如:在五次迭代中,rgb-028-057.JPG这张图片五次都被预测错了,其中预测成第55类为4次,预测为33类为1次,**要求预测错误的图片按照预测失败的次数从高到低的顺序排序**。则格式如下:原创 2021-04-06 22:45:48 · 1529 阅读 · 0 评论 -
Python处理图像分类数据集之如何模拟CUB200数据集格式
假如你有数据集,那么在跑论文的时候,如何准备自己的数据集呢,鉴于CUB200已经是主流的细粒度分类数据集,不妨模拟一下这个数据集的格式吧!如果你的数据集已经按照类别分好了,可以参考:https://blog.csdn.net/hb_learing/article/details/115466277然后再参考这篇文章:1、创建images.txt文件#images.txtpath="D:\\数据\\216_2021\\images"f=open("D:\\数据\\216_2021\\images原创 2021-04-06 18:34:35 · 2099 阅读 · 12 评论 -
Python 处理图像分类数据集之训练集、测试集分离(随机)
本段代码的功能是以一定的比例来划分数据集为测试集、训练集,且在不改变原数据集的情况下把属于每一个类别的训练集和测试集图片copy到另外两个文件夹train、test下:只需给出上图文件夹所在绝对路径、训练集和测试集的划分比例即可:import osimport randomimport shutilimport csvimport numpy as npdef CopyFile(imageDir,test_rate,save_test_dir,save_train_dir):#三个参数,第一原创 2021-04-06 17:47:38 · 8362 阅读 · 7 评论 -
CUB200分割训练集测试集到txt文件
有时候跑代码需要从文件里面读取图片到内存代打如下:import osimport shutilimport numpy as npimport timetime_start = time.time()# 文件路径path_images = 'D:/BaiduNetdiskDownload/CUB_200_2011/CUB_200_2011/images.txt'path_split = 'D:/BaiduNetdiskDownload/CUB_200_2011/CUB_200_2011/原创 2021-03-31 22:55:51 · 1286 阅读 · 3 评论 -
Python批量重命名深度学习图像分类数据集图片
做深度学习图像分类拿到新的数据集不可避免的要对图片进行批量数理,以下整理的了我的思路,供大家参考。主要用到了os库,re库。原始数据展示:可看到不同鸟种所在文件夹名与图片名毫无规律,不便于后期数据集的加载与处理。这段代码包含了两层循环:第一层对原文件夹名提取中文字符,即鸟类名字,然后对所有文件夹标上种类编号。第二层循环就是对每一个文件夹下的图片进行规范命名,“格式为:rgb-序号-种类编号.JPG”import osimport repath="D:\\深度学习数据\\bird2.0...原创 2021-02-01 10:56:04 · 942 阅读 · 5 评论