resize训练集图片大小并存储的方法

我们做深度学习训练时,需要大量的图片(数据),这些图片往往尺寸不一,也不是我们input的尺寸需求。如果我们能在训练前就将这些图片resize成需要的尺寸,那么训练过程将会非常省时省资源的。

resize图片大小的方法有两种:

一、#直接基于原图片中心点为中心,以原图片较短边切割成边长为原长方形较短边为边长的正方形

代码如下:

'''
[1]  #直接基于原图片中心点为中心,以原图片较短边切割成边长为原长方形较短边为边长的正方形
#如test.jpg和crop_img.jpg,部分长宽比例较大的图形经过切割可能会丢失重要的信息,故一般不用!

import matplotlib.image as mpimg

def load_image(path):
    # 读取图片,rgb
    img = mpimg.imread(path)
    # 将图片修剪成中心的正方形
    short_edge = min(img.shape[:2])
    yy = int((img.shape[0] - short_edge) / 2)
    xx = int((img.shape[1] - short_edge) / 2)
    crop_img = img[yy: yy + short_edge, xx: xx + short_edge]
    mpimg.imsave('crop_img',crop_img)
    return crop_img

load_image('./test.jpg')
'''

输入图片
在这里插入图片描述
输出图片
在这里插入图片描述
显而易见:如果按照方法一做简单的切割,很容易丢失大量有用的信息,导致训练正确率低,甚至出现错误,故我们一般不用这种方法

二、#推荐的resize并存储的方法如下(双线性插值,或者双三次插值)

代码如下

[2]#推荐的resize并存储的方法如下

'''
1、我们将搜集到的图片存放在与软件脚本同一根目录下的'./data/image/pre_train/'文件夹下;
2、我们使用Image模块从pre_train文件夹读取图片,resize,并存储入'./data/image/train/'文件夹;
'''

from PIL import Image
import os

src_path = './data/image/pre_train/'
dst_path = './data/image/train/'

filelist=os.listdir(src_path)

for img in filelist:
    image=Image.open(src_path+img)
    image_resize=image.resize((224,224),resample=2)
    #image.resize(size,resample=0)  #sesam用于表示改变图像过程中的插值方法,0:双线性插值;1:最邻近插值;2:双三次插值;3|面积插值法
    #参考:python: PIL的Image.resize()函数:
    image_resize.save(dst_path+img)

还是那只猫,我们看看这次处理后的效果
在这里插入图片描述
还是一眼就认出这是只猫,对不对?!

我们在对比下处理前后的数据集
在这里插入图片描述
在这里插入图片描述

参考资料:
1、Python:PIL的 Image.resize()函数:https://blog.csdn.net/weixin_40522801/article/details/106491212?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522161703255516780266279470%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%2522%257D&request_id=161703255516780266279470&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2allfirst_rank_v2~rank_v29-1-106491212.first_rank_v2_pc_rank_v29&utm_term=python%3A+PIL%E7%9A%84Image.resize%28%29%E5%87%BD%E6%95%B0&spm=1018.2226.3001.4187
2、python 转换图片大小,并保存:https: // blog.csdn.net / SHAOYEZUIZUISHAUI / article / details / 103299503

  • 4
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
将多个照片转换为CSV格式作为训练集需要进行以下步骤: 1. 将每张照片转换为像素矩阵,可以使用Python中的Pillow或OpenCV库来实现。 2. 将每个像素矩阵展平为一维数组,并将其存储到一个数据框中,可以使用Pandas库来实现。 3. 将每个数据框保存为CSV文件,这些CSV文件将作为训练集。 下面是一个简单的Python代码示例,演示如何将多个照片转换为CSV格式的训练集: ```python import os import numpy as np import pandas as pd from PIL import Image # 定义图像目录和CSV文件名 image_dir = './images/' csv_filename = 'training_set.csv' # 定义图像尺寸 image_size = (32, 32) # 读取图像文件并转换为一维数组 data = [] for filename in os.listdir(image_dir): if filename.endswith('.jpg'): # 打开图像文件并将其调整为指定的大小 image = Image.open(os.path.join(image_dir, filename)) image = image.resize(image_size) # 将图像像素矩阵展平为一维数组 pixels = np.array(image).flatten() # 将图像的像素值添加到数据列表中 data.append(pixels) # 将数据转换为Pandas数据框并保存为CSV文件 df = pd.DataFrame(data) df.to_csv(csv_filename, index=False) ``` 在这个示例中,我们假设所有的图像存储在"./images/"目录中,图像文件都以".jpg"结尾。我们还假设所有的图像都具有相同的尺寸,可以通过调整image_size变量来指定。最后,我们将所有的图像数据存储在一个Pandas数据框中,并将其保存为CSV文件。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值