【深度学习】【PaddlePaddle】DAY 6 - 图像分类问题：手写数字识别案例（六）

最新推荐文章于 2024-04-21 15:39:29 发布

Venistar

最新推荐文章于 2024-04-21 15:39:29 发布

阅读量577

点赞数

分类专栏：深度学习 paddlepaddle 文章标签：神经网络深度学习

本文链接：https://blog.csdn.net/weixin_47074246/article/details/108338302

版权

深度学习课程 DAY 6 - 图像分类问题：手写数字识别案例（六）

Chapter 3 图像分类问题
- 3.7 模型优化之资源配置

Chapter 3 图像分类问题

3.7 模型优化之资源配置

（1）概述

从前几节的训练看，无论是房价预测任务还是MNIST手写字数字识别任务，训练好一个模型不会超过十分钟，主要原因是我们所使用的神经网络比较简单。但实际应用时，常会遇到更加复杂的机器学习或深度学习任务，需要运算速度更高的硬件（如GPU、NPU），甚至同时使用多个机器共同训练一个任务（多卡训练和多机训练）。探讨在手写数字识别任务中，通过资源配置的优化，提升模型训练效率的方法。

在这里插入图片描述

（2）单GPU训练

动态图通过fluid.dygraph.guard(place=None)里的place参数，设置在GPU上训练还是CPU上训练。

with fluid.dygraph.guard(place=fluid.CPUPlace())　#设置使用CPU资源训神经网络。
with fluid.dygraph.guard(place=fluid.CUDAPlace(0))　#设置使用GPU资源训神经网络，默认使用服务器的第一个GPU卡。"0"是GPU卡的编号，比如一台服务器有的四个GPU卡，编号分别为０、１、２、３。

#仅前3行代码有所变化，在使用GPU时，可以将use_gpu变量设置成True
use_gpu = False
place = fluid.CUDAPlace(0) if use_gpu else fluid.CPUPlace()

with fluid.dygraph.guard(place):
    model = MNIST()
    model.train()
    #调用加载数据的函数
    train_loader = load_data('train')
    
    #四种优化算法的设置方案，可以逐一尝试效果
    optimizer = fluid.optimizer.SGDOptimizer(learning_rate=0.01, parameter_list=model.parameters())
    #optimizer = fluid.optimizer.MomentumOptimizer(learning_rate=0.01, momentum=0.9, parameter_list=model.parameters())
    #optimizer = fluid.optimizer.AdagradOptimizer(learning_rate=0.01, parameter_list=model.parameters())
    #optimizer = fluid.optimizer.AdamOptimizer(learning_rate=0.01, parameter_list=model.parameters())
    
    EPOCH_NUM = 2
    for epoch_id in range(EPOCH_NUM):
        for batch_id, data in enumerate(train_loader()):
            #准备数据，变得更加简洁
            image_data, label_data = data
            image = fluid.dygraph.to_variable(image_data)
            label = fluid.dygraph.to_variable(label_data)
            
            #前向计算的过程
            predict = model(image)
            
            #计算损失，取一个批次样本损失的平均值
            loss = fluid.layers.cross_entropy(predict, label)
            avg_loss = fluid.layers.mean(loss)
            
            #每训练了200批次的数据，打印下当前Loss的情况
            if batch_id % 200 == 0:
                print("epoch: {}, batch: {}, loss is: {}".format(epoch_id, batch_id, avg_loss.numpy()))
            
            #后向传播，更新参数的过程
            avg_loss.backward()
            optimizer.minimize(avg_loss

最低0.47元/天解锁文章

Venistar

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【深度学习】【PaddlePaddle】DAY 6 - 图像分类问题：手写数字识别案例（六）

深度学习课程 DAY 6 - 图像分类问题：手写数字识别案例（六）Chapter 3 图像分类问题3.7 模型优化之资源配置（1）概述（2）单GPU训练（3）分布式训练1）模型并行2）数据并行① PRC通信方式② NCLL2通信方式（Collective）Chapter 3 图像分类问题3.7 模型优化之资源配置（1）概述从前几节的训练看，无论是房价预测任务还是MNIST手写字数字识别任务，训练好一个模型不会超过十分钟，主要原因是我们所使用的神经网络比较简单。但实际应用时，常会遇到更加复杂的机器学习
复制链接

扫一扫