分批读取训练数据进行训练

最新推荐文章于 2023-12-20 14:11:30 发布

Chaojun_Shi

最新推荐文章于 2023-12-20 14:11:30 发布

阅读量1.7k

点赞数 1

分类专栏：深度学习

本文链接：https://blog.csdn.net/qq_21466543/article/details/107150645

版权

训练集数据量过大受设备内存影响不能将全部数据直接放到网络中进行训练，需要分批读取训练数据。

train_x为训练集地址，train_y为训练集标签，val_X为验证集数据，val_y为验证集标签。

分批读取函数如下：


def dataset_split(images, labels, batch_size):
    while 1:
        i = 0
        n = math.ceil(len(images)/batch_size)
        print(n)
        for j in range(n):
            if j != n-1:
                x = images[i : i + batch_size]
                y = labels[i : i + batch_size]
                i = i + batch_size
                X = []
                for m in range(len(x)):
                    a = cv2.imread(x[m])
                    #print(type(a))
                    a = a.tolist()
                    #print(type(a))
                    X.append(a)
                X = np.array(X)
                yield X, y
                
            if j == n-1:
                x = images[len(images)-batch_size: ]
                y = labels[len(labels

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Chaojun_Shi

关注关注

1
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
分批读取训练数据进行训练

训练集数据量过大受设备内存影响不能将全部数据直接放到网络中进行训练，需要分批读取训练数据。train_x为训练集地址，train_y为训练集标签，val_X为验证集数据，val_y为验证集标签。分批读取函数如下：def dataset_split(images, labels, batch_size): while 1: i = 0 n = math.ceil(len(images)/batch_size) print(n)
复制链接

扫一扫