《昇思25天学习打卡营第1天|快速入门》

chenqqyun

已于 2024-07-18 08:41:59 修改

阅读量927

点赞数 13

文章标签：学习人工智能

于 2024-07-17 19:29:03 首次发布

本文链接：https://blog.csdn.net/chenqqyun/article/details/140502679

版权

本节通过MindSpore的API来快速实现一个简单的深度学习模型。

安装库

# 实验环境已经预装了mindspore==2.3.0rc1，如需更换mindspore版本，可更改下面mindspore的版本号，实验环境不需要安装以下库的安装

导入库

跟其他Python库导入一样

处理数据集

MindSpore提供基于Pipeline的数据引擎，通过数据集（Dataset）和数据变换（Transforms）实现高效的数据预处理。在本教程中，我们使用Mnist数据集，自动下载完成后，使用mindspore.dataset提供的数据变换进行预处理。

本章节中的示例代码依赖download，可使用命令pip install download安装。如本文档以Notebook运行时，完成安装后需要重启kernel才能执行后续代码。

MNIST数据集目录结构如下：

MNIST_Data
└── train
    ├── train-images-idx3-ubyte (60000个训练图片)
    ├── train-labels-idx1-ubyte (60000个训练标签)
└── test
    ├── t10k-images-idx3-ubyte (10000个测试图片)
    ├── t10k-labels-idx1-ubyte (10000个测试标签)

MindSpore的dataset使用数据处理流水线（Data Processing Pipeline），需指定map、batch、shuffle等操作。这里我们使用map对图像数据及标签进行变换处理，然后将处理好的数据集打包为大小为64的batch。

可使用create_tuple_iterator 或create_dict_iterator对数据集进行迭代访问，查看数据和标签的shape和datatype。

更多细节详见数据集 Dataset与数据变换 Transforms。

网络构建

mindspore.nn类是构建所有网络的基类，也是网络的基本单元。当用户需要自定义网络时，可以继承nn.Cell类，并重写__init__方法和construct方法。__init__包含所有网络层的定义，construct中包含数据（Tensor）的变换过程。

模型训练

在模型训练中，一个完整的训练过程（step）需要实现以下三步：

正向计算：模型预测结果（logits），并与正确标签（label）求预测损失（loss）。
反向传播：利用自动微分机制，自动求模型参数（parameters）对于loss的梯度（gradients）。
参数优化：将梯度更新到参数上。

MindSpore使用函数式自动微分机制，因此针对上述步骤需要实现：

定义正向计算函数。
使用value_and_grad通过函数变换获得梯度计算函数。
定义训练函数，使用set_train设置为训练模式，执行正向计算、反向传播和参数优化。

除训练外，我们定义测试函数，用来评估模型的性能。

训练过程需多次迭代数据集，一次完整的迭代称为一轮（epoch）。在每一轮，遍历训练集进行训练，结束后使用测试集进行预测。打印每一轮的loss值和预测准确率（Accuracy），可以看到loss在不断下降，Accuracy在不断提高。

保存模型

模型训练完成后，需要将其参数进行保存。

加载模型

加载保存的权重分为两步：

重新实例化模型对象，构造模型。
加载模型参数，并将其加载至模型上。

param_not_load是未被加载的参数列表，为空时代表所有参数均加载成功。

加载后的模型可以直接用于预测推理。

个人心得

上个月刚学习了Transformers模块，让我对模型有了初步的了解。今天第一天学习了《快速入门》，对MindSpore框架里面基础知识能够理解，通过对MindSpore的架构的了解，结合demo对MindSpore的数据集处理、网络构建、模型训练以及模型推理的一些基础代代码的执行，感受到模型训练的过程，通过亲自动手实践的效果远比简单看一遍要好的多，希望自己能坚持打卡，开启智能之路。