训练过程acc_跟着雨哥学AI系列之三：详解飞桨框架模型训练

最新推荐文章于 2024-08-04 14:59:50 发布

xr7m99

最新推荐文章于 2024-08-04 14:59:50 发布

阅读量988

点赞数

文章标签：训练过程acc

本文链接：https://blog.csdn.net/weixin_33195817/article/details/112715094

版权

本文介绍了飞桨框架的模型训练过程，包括模型训练配置、使用model.fit接口进行全流程训练、自定义训练计算过程以及模型评估和预测。通过高层API和基础API的运用，帮助读者理解飞桨在深度学习训练中的应用。

摘要由CSDN通过智能技术生成

点击左上方蓝字关注我们

课程简介： “跟着雨哥学AI”是百度飞桨开源框架近期针对高层API推出的系列课。本课程由多位资深飞桨工程师精心打造，不仅提供了从数据处理、到模型组网、模型训练、模型评估和推理部署全流程讲解；还提供了丰富的趣味案例，旨在帮助开发者更全面清晰地掌握百度飞桨框架的用法，并能够举一反三、灵活使用飞桨框架进行深度学习实践。

1. 什么是模型训练？

在深度学习领域，我们经常听到「模型训练」这一关键词，上节课中我们详细的解释了什么是模型以及模型是如何组建的，这节课我们需要考虑「什么是模型训练？」「为什么要进行模型训练？」「我们如何进行模型的训练？」，甚至我们还会好奇「模型训练的结果是什么？」。以识别任务为例，如下图所示，面对大量的数据和素材，我们的目的就是使用我们设计并组建的模型(算法)能够实现对目标进行准确的识别。那么这一目标也就是我们进行模型训练的原动力，为了达到这一目标，我们需要有一个好的算法，而算法对应的就是我们上节课讲述的模型，这套算法里面包含若干的关键权重信息，用于指导每个模型(算法)节点如何对输入数据做特征提取，在刚建设好模型的时候，这些权重信息会随机设置，效果很差，无法直接用于我们的任务使用，我们就需要为算法找到一组最合适的权重参数，这组权重参数就是我们模型训练后得到的结果。总的来说，模型训练其实就是我们使用大量的数据「调教」模型(算法)找出最优权重参数的过程。

那么如何才能进行模型训练呢？

2. 模型训练详解

以往我们实现模型训练时常常需要面对非常繁杂的代码，要写好多步骤，才能正确的使程序运行起来。这些代码里面包含比较多的概念和接口使用，刚刚上手的同学们一般需要花比较多的时间和精力来弄明白相关的知识和使用方法，使得许多开发者望而却步。为了解决这种问题，同时满足新手开发者和资深开发者，既能够减少入门的难度，提升开发的效率，又能拥有较好的定制化能力。飞桨框架提供了两种模型训练的方法：一种是基于基础API的常规训练方式；另一种是用paddle.Model对组建好的模型进行封装，通过高层API完成模型的训练与预测，可以在3-5行内，完成模型的训练。前者适合框架经验比较多的资深开发者，而后者极大的简化了学习和开发的代码量，对初学者用户非常友好。接下来我们就进行到详细的讲解环节吧。 Note: 高层API实现的模型训练与预测API都可以通过基础API实现，本文着重介绍高层API的训练方式，然后会将高层API拆解为基础API，方便同学们对比学习。

2.1 模型训练配置

什么是模型训练配置呢？ 这里是我们做的一个概念抽象，在模型训练的时候我们需要选用和指定我们要使用的梯度优化器、损失函数计算方法和模型评估指标计算方法，那么我们可以在正式启动训练之前对这些所需的必备内容做一个统一配置。 那么如何进行模型训练配置呢？ 第一步就是我们需要使用paddle.Model接口完成对模型的封装，将网络结构组合成一个可快速使用高层API进行训练和预测的类。完成模型的封装以后，我们便可以使用model.prepare接口实现模型的配置。为了完整的实现这个过程，我们就一起回忆一下前几节课的内容，进行数据的处理和加载、模型组建、模型的封装以及模型配置吧。 数据的处理与加载

1]

模型的组建

In [3]# 模型的组建
mnist = nn.Sequential(
nn.Flatten(),
nn.Linear(784, 512),
nn.ReLU(),
nn.Linear(512, 10))

模型的封装

In [5]# 将网络结构用 Model类封装成为模型
model = paddle.Model(mnist)

模型训练配置

In [6]# 为模型训练做准备，参数optimizer设置优化器，参数loss损失函数，参数metrics设置精度计算方式
model.prepare(optimizer=paddle.optimizer.Adam(parameters=model.parameters()),
loss=paddle.nn.CrossEntropyLoss(),
metrics=paddle.metric.Accuracy())

2.2 模型训练

完成模型的配置工作以后，我们可以正式进入模型训练环节。那么如何进行模型训练呢？飞桨框架进行模型训练有3种方式来完成：

全流程的训练启动，包含轮次迭代，数据集迭代，模型评估等，我们可以使用高层APImodel.fit接口来完成；
对于一些单轮训练内部定制化训练计算过程可以自己手写轮次和数据集迭代，通过高层APImodel.train_batch来实现单个批次数据的训练操作，比如训练GAN类型的网络，需要同时训练生成器和辨别器两个网络；
如果每个计算细节都想自定义来完成，我们也可以直接使用基础API来实现整个训练过程。

接下来我们就给大家展示下3种方式的使用示例代码来具体了解一下接口的使用方式。 2.2.1 全流程模型训练model.fit接口

7]
The loss value printed

2.2.2 单批次模型训练model.train_batch接口 那么我们如果使用train_batch来实现整个训练过程代码是如何编写呢，下面我们为大家展示一下。

8]
epoch:

2.2.3 基础API实现模型训练 使用高层API实现模型训练只需要一行代码就可以搞定，比较方便。有的时候我们的任务比较复杂，整个训练过程发现高层API的封装无法来达到预期目标，这个时候我们也可以将上述用高层API实现的过程拆解成用基础API的实现。

9]
epoch:

2.3 模型评估

模型训练结束后，我们得到了一组精度看起来还不错的模型参数，但是这组参数到底好还是不好还需要我们去具体做下评估。 那么何为模型评估呢？ 模型评估其实就是使用我们预留的验证数据放到所得到的模型中进行实际的预测并基于标签进行校验，来看模型在验证集上的精度表现，模型的好坏直接影响我们的目标任务是否可以实现。模型评估的代码实现在高层API中也非常地简单，我们事先定义好用于评估使用的数据集后，可以简单的调用飞桨高层API提供的model.evaluate接口或model.eval_batch接口完成模型评估操作，其中model.eval_batch接口是在一个批次的数据上进行评估测试。操作结束后会根据prepare接口配置的loss和metric来进行相关指标计算返回。 2.3.1 全流程评估model.evaluate接口

In [10]
# 用 model.evaluate 在测试集上对模型进行验证
eval_result = model.evaluate(test_dataset, verbose=1)
Eval begin...
The loss value printed in the log is the current batch, and the metric is the average value of previous step.
step 10000/10000 [==============================] - loss: 0.0000e+00 - acc: 0.9766 - 2ms/step
Eval samples: 10000

2.3.2 单批次model.eval_batch接口

11]0, loss: [array([

2.3.3 基础API实现模型评估 类似地，我们来了解一下使用基础API如何实现模型评估功能。如下代码所示，和模型训练功能相似，使用基础API实现模型评估需要数据的加载和读取，损失函数和精度的定义，需要十几行代码，使用高层API只需要一行代码就可以完成模型的评估。

12]
batch_id:

2.4 模型预测

从数据的处理到模型的组建再到模型的训练，其实我们的终极任务是希望我们的模型可以真正的用起来。如果是模型评估的结果符合我们的期望，我们就模型就可以真正的使用了，那就是模型预测。那么如何进行模型预测呢？飞桨高层API中提供了model.predict接口和model.predict_batch接口来方便用户对训练好的模型进行预测验证，只需要基于训练好的模型将需要进行预测测试的数据放到接口中进行计算即可，接口会把模型计算得到的预测结果返回，从而完成我们的任务。 2.4.1 使用高层API全流程预测接口 model.predict

In [13]
# 用 predict 在测试集上对模型进行测试
test_result = model.predict(test_dataset)

# 可以在后面继续加上自己对于预测数据的处理
Predict begin...
step 10000/10000 [==============================] - 2ms/step
Predict samples: 10000

2.4.2 使用高层API单批次预测接口 model.predict_batch

In [14]
# 用 predict_batch 在测试集一个批次的数据上进行测试
predict_loader = paddle.io.DataLoader(test_dataset, batch_size=64)

for batch_id, batch_data in enumerate(predict_loader):
    inputs = batch_data[0]
    test_result = model.predict_batch([inputs])
    # 可以在后面继续加上自己对于预测数据的处理
    print("predict finished")
    predict finished

2.4.3 使用基础API来完成模型预测 如果将高层API的实现拆解，使用基础API来操作的话，那么对应的代码如下：

In [15]
# 定义测试数据集加载器
test_loader = paddle.io.DataLoader(test_dataset, batch_size=64)

# 将网络结构的模式变成评估
mnist.eval()

# 加载数据进行迭代预测
for batch_id, batch_data in enumerate(test_loader):
    inputs = data[0]
    predicts = mnist(inputs)
    # 可以在后面继续加上自己对于预测数据的处理

    print("predict finished")
    predict finished

总结

本节课首先为大家详细的讲解了什么是模型训练以及为什么要进行模型训练。然后和同学们一起学习了如何进行模型训练，并且在学习过程中，我们还复习了数据的预处理和加载以及模型组建等前面所学的课程，详细介绍了飞桨框架提供的4个模型训练的功能，且将高层API的代码实现拆解成基础API，方便同学们对比学习。到这里，同学们已经基本掌握了模型训练的一整套流程了，课后同学们一定要多练习，自己完成一个小项目。为了让同学们的学习节奏变的紧凑，下周我们将会发布两篇高层API的高阶用法的内容，大家如果有什么希望实现的模型或者感兴趣的趣味案例都可以在评论区留言，我们将会在后续的课程中给大家安排上哈，今天的课程到这里就结束了，我是雨哥，下节课见~

回顾往期：

第一篇：『跟着雨哥学AI』系列：详解飞桨框架数据管道

第二篇：『跟着雨哥学AI』系列之二：详解飞桨框架模型组网

有任何问题可以在本项目中评论或到飞桨Github仓库(链接)提交Issue。 同时欢迎扫码加入飞桨框架高层API技术交流群

如在使用过程中有问题，可加入官方QQ群进行交流： 778260830 。如果您想详细了解更多飞桨的相关内容，请参阅以下文档。 ·飞桨官网地址· https://www.paddlepaddle.org.cn/ ·飞桨开源框架项目地址· GitHub: https://github.com/PaddlePaddle/Paddle Gitee: https://gitee.com/paddlepaddle/Paddle

微信号 : PaddleOpenSource

飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础，是中国首个开源开放、技术领先、功能完备的产业级深度学习平台，包括飞桨开源平台和飞桨企业版。飞桨开源平台包含核心框架、基础模型库、端到端开发套件与工具组件，持续开源核心能力，为产业、学术、科研创新提供基础底座。飞桨企业版基于飞桨开源平台，针对企业级需求增强了相应特性，包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。EasyDL主要面向中小企业，提供零门槛、预置丰富网络和模型、便捷高效的开发平台；BML是为大型企业提供的功能全面、可灵活定制和被深度集成的开发平台。