将DataLoader训练数据分块保存

最新推荐文章于 2023-10-10 10:38:38 发布

EmoC001

最新推荐文章于 2023-10-10 10:38:38 发布

阅读量1k

点赞数 1

分类专栏： Deep Learning 文章标签： pytorch 深度学习 python

本文链接：https://blog.csdn.net/u013302570/article/details/120353481

版权

Deep Learning 专栏收录该内容

12 篇文章 1 订阅

订阅专栏

有时候需要将数据存放在本地，但是Dataloader有Size限定。

import numpy as np

limit = 1024**3.8  # 假设最大为4GB => 1024MB * 3.8 (需要预留额外的内存，不能满)
save_path = ''  # 设置dataloader的存储路径（默认当前运行路径）
data = np.ones((180000,60,80)).astype('float64')  # 假设数据是一个numpy类型的
batchsize = 128

# chunk data
len_tmp = data.shape[0]
if len_tmp%batchsize != 0:
  less_num = batchsize-(len_tmp - int(len_tmp/batchsize) *batchsize)
  new_tmp = data[:less_num].copy()
  tmp = np.vstack((tmp,new_tmp))

num_chunk = math.ceil(data.size / limit)
unit_portion = data.size//num_chunk
unit_element = unit_portion//data[0].size
fn = [save_path,'','dataloader.pth']
for x in range(num_chunk):
    train_loader = DataLoader(data[x*unit_element:(x+1)*unit_element], shuffle=True, batch_size=batchsize, drop_last=False)
    fn[1] = str(x)
    torch.save(train_loader, ''.join(fn))

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

EmoC001

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
将DataLoader训练数据分块保存

limit = 1024**2.8import matplotlib.pyplot as pltimport mathtmp = np.zeros((len(files),60,80)).astype('float64')plt.figure('FFT', figsize=(8, 6), dpi=80)for i,img in enumerate(files): Frame = cv2.imread(data_path+img) Frame = cv2.cvtColor(Frame, cv
复制链接

扫一扫