Keras批量训练大量数据总结

最新推荐文章于 2020-11-27 03:30:40 发布

xyp_8023

最新推荐文章于 2020-11-27 03:30:40 发布

阅读量9.1k

点赞数 2

分类专栏：机器学习文章标签： Keras 内存问题批量训练

本文链接：https://blog.csdn.net/qq_23141851/article/details/81174758

版权

机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

在深度学习中，有时会遇到大量数据的情况，比如处理120万+的图片时，需要批量训练。

因为内存有限，可能一次只能读进来一批图片，一个可行的方案是使用train_on_batch这个函数，大概流程如下：

import random

batch_X, batch_Y = get_train_data()

# shuffle data
cc = list(zip(batch_X, batch_Y))
random.shuffle(cc)
batch_X[:], batch_Y[:] = zip(*cc)
del cc

model.train_on_batch(batch_X, batch_Y)

由于train_on_batch不提供shuffle=True的选项，我便选择手动shuffle数据。

当然也可以使用data generators来解决这个问题。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

xyp_8023

关注关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

如何从 Keras 中的深度学习目录加载大型数据集

gongdiwudu的专栏

01-11

2675

数据集读取，使用、在磁盘上存储和构建图像数据集有一些约定，以便在训练和评估深度学习模型时能够快速高效地加载。本文介绍Keras 深度学习库中的ImageDataGenerator类等工具自动加载训练、测试和验证数据集。

keras如何批量读取图片_Keras做图片分类（一）：图片的导入与处理

weixin_34893745的博客

12-24

797

图片处理的库比较多，以本人了解的pillow和opencv两个库为例，分别进行常用的导入、展示、裁取、resize等图片预处理中可能会用到的操作，并在最后进行keras图片任务中数据的载入示例。以下代码均在Jupyter notebook上完成。pillowPillow是Python里的图像处理库(PIL：Python Image Library)，提供了了广泛的文件格式支持，强大的图像处理能力，...

参与评论您还未登录，请先登录后发表或查看评论

使用Keras 的ImageDataGenerator类实现批量数据增强

12-22

今天使用了Keras 的ImageDataGenerator类，发现真是小白的神器。我们在进行机器学习的时候，常常为自己找不到相关的数据集而自己搭建一个数据集。那么，相关的问题就是数据样本不够大，之后的机器学习就很有能造成过拟合问题，神经网络找不到抽象的特征等。究根结底还是样本数量不够。那我又不可能拿着相机一个一个去拍啊……. 总之就想要更多的数据集呗。有关于ImageDataGenerator的相关信息，这篇博客已经写得非常好了–>keras的图像预处理全攻略（二）—— ImageDataGenerator 类, 有关于ImageDataGenerator类的用法什么的可以查它下面是全

使用 keras 训练大规模数据

luoganttcc的博客

10-18

1473

参考1 参考2 train_on_batch

keras中文文档_Keras做图片分类（二）：图片的分批读取和数据增强

weixin_39930557的博客

11-27

400

理想情况下，如果我们拥有无限多的样本，就可以训练出近乎完美的模型。但是绝大多数情况下这是不现实的，我们拿到的是有限的样本，样本量不足会导致模型过分的专注于这些样本的学习而不能够得到鲁棒性好、泛化能力强的模型，即会产生过拟合问题。实际上，在深度学习的训练中，过拟合倒不是问题，因为我们在训练模型时都要将之训练到过拟合来查看当前模型当前样本的极限在哪里，我们只需保存到loss最低效果最好的模型权重即可。...

keras笔记(4)-使用Keras训练大规模数据集

pursuit_zhangyu的博客

12-24

3056

简介官方提供的.flow_from_directory(directory)函数可以读取并训练大规模训练数据，基本可以满足大部分需求，可以参考我的笔记。但是在有些场合下，需要自己读取大规模数据以及对应标签，下面提供一种方法。这个方法是读取图片的地址保存到内存中，这样就不会出现内存不足情况了。下面我使用的数据集是猫狗的数据集，下载地址猫狗数据集：https://pan.baidu.com...

数据集扩增小技巧(keras实现数据增强)

T_z_c_h333的博客

08-24

1708

百度直接进入keras官网找到Image Preprocessing类根据需求填写对应的参数可快速增加自己的数据集

keras resnet 训练自己的数据

04-30

这种预训练模型已经在大规模数据集上学习到了丰富的特征，可以作为新任务的起点，从而节省大量的训练时间和计算资源。在Keras中，我们可以直接使用`keras.applications.resnet50`模块加载预训练的ResNet50模型。...

Keras预训练的ImageNet模型实现分类操作

09-16

Keras提供了预训练的ImageNet模型，这些模型已经在ImageNet数据集上进行了训练，可以用于各种计算机视觉任务，如图像分类、特征提取等。本篇文章主要探讨了如何利用Keras中的预训练模型VGG16、InceptionV3、ResNet...

keras和tensorflow使用fit_generator 批次训练操作

12-17

`keras` 和 `tensorflow` 中的 `fit_generator` 函数是深度学习模型进行批量训练的核心工具，尤其适用于处理大量数据或需要实时生成数据的情况。`fit_generator` 的设计允许模型在训练过程中从生成器中获取数据，而...

Keras ResNet50分类网络，训练大量图像方法

baidu_36746428的博客

05-06

1847

Keras框架常用的两种训练函数 Keras框架常用两种训练函数model.fit()和model.fit_generator()函数。 model.fit() fit( x, y, batch_size=32, epochs=10, verbose=1, callbacks=None, validation_split=0.0, validation_data=None, shuffle=Tr...

keras 数据增强三种思路

乱七八糟的笔记

05-06

1604

任务描述：对原始图片与标注图片做相同的数据增强。保持标签与图片的一致。最优选择：keras 可用，用起来简单，自己写的代码尽量少，避免出错。 https://blog.csdn.net/qq_28792801/article/details/80866234 https://blog.csdn.net/u010397980/article/details/88088025 open...

opencv基础功能

weixin_44414593的博客

09-10

437

看这个链接cv2常用功能 import cv2 import matplotlib.pyplot as plt %matplotlib inline 读取图片 img = cv2.imread(‘C:/ml_data/catsvsdogs/train/cat.0.jpg’) 显示图片 cv2.imshow(‘ipg_name’,img) #jupyter notebook 不能在cell中使用，使用plt.imshow代替 plt.imshow(img) 图片属性 img.shape：打印图片的高、宽和通

keras使用fit_generator批量训练二分类模型

HunterLiXiaoLong的博客

10-09

737

代码实现的影像数据的批量训练，fit_generator()就是将原始影像和标签数据打包在一起成一个tuple，然后再喂给模型训练。 import os import warnings warnings.filterwarnings("ignore") import numpy as np import random import PIL.Image as img from skimage.transform import resize from skimage.io import imread from

keras批量图片生成器generator：解决训练集过大无法一次喂入

万事胜意

11-20

2112

参考链接：https://blog.csdn.net/mieleizhi0522/article/details/82191331 还记得在跑mnist的时候，训练集里有60000张黑白图片，每张图片为28*28，把所有图片塞到一个矩阵里面一点问题都没有。现在就不一样了，我的数据集里大概有90000张彩色图片，大小就是384*512*3，这远远大于mnist的训练集，如果同时将它们塞进...

keras 分批训练详解 - keras进阶系列01

蓝一潇的博客

02-14

1万+

我们今天来讲一讲使用keras框架来进行分批训练刚入门的深度学习爱好者由于数据量不是很大，倾向于将所有数据读入内存之后直接送入模型进行学习，这样的优点是简单，复杂度小，但是缺点也非常明显：能训练的数据较少，无法训练较大的模型。那些在网上的教程，或者是所谓的“深度学习课程”往往对这个问题避而不谈，估计是商业目的使然。而真正的商用的模型往往需要几天时间甚至几个月时间来训练。那么，用keras怎么来训...

【Keras】使用Keras建立模型并训练等一系列操作