昇思25天学习打卡营第1天打卡心得

最新推荐文章于 2024-09-25 09:27:18 发布

务实的幻想家

最新推荐文章于 2024-09-25 09:27:18 发布

阅读量804

点赞数 25

文章标签：学习

本文链接：https://blog.csdn.net/magicianla/article/details/140442978

版权

今天学习了一会儿昇思大模型平台的课程，主要是看了基本介绍和快速入门这两个章节。

1.基本介绍

看了基本介绍，发现平台应用领域很广，包括机器视觉，音频，自然语言处理，模型集成等一系列套件，还支持电磁仿真、分子模拟、量子计算。它还提供了统一的API接口，提供编译器功能，提供可视化调试调优工具，还适配GPU,CPU等多种硬件。这样的一个集大成的平台想必一开始就是以降低大模型平台的使用门槛，统一大模型平台的使用工具而设计开发的。我特别想说的是平台提供了三个层次的API接口：从高到低分别为High-Level Python API、Medium-Level Python API以及Low-Level Python API。按照官方的描述，高阶API提供了更好的封装性，低阶API提供了更好的灵活性，中阶API兼顾灵活与封装。这样的分层设计，为平台模型的定制化提供了更广阔的空间。有独特模型定制需求的工程师可以通过低阶API修改模型，定义张量。像我这样的不关心底层设计的直接用高阶API应该也会比较方便。

2.快速入门

接下来说一下快速入门这个章节。这个章节应用MindSpore的API实现了一个简单的深度学习模型，按照(1)处理数据集(2)网络构建(3)模型训练(4)保存模型(5)加载模型的流程顺序，讲解了怎么使用平台API进行模型训练和处理。

(1)处理数据集

在处理数据集之前，先导入了mindspore库，看上去像个总的封装库，然后导入nn，由后面的说明可知这个nn应该是神经网络相关的模块。然后右导入了数据集中的vision,transforms,和MnistDataset,这些应该就是用来做图像处理的基础数据集了。

然后第二步就是下载数据集，没什么好说的。

第三步和第四步下载和打印数据集，获取数据集列名然后用于数据处理。

第五步和第六步按官方说明是“MindSpore的dataset使用数据处理流水线（Data Processing Pipeline），需指定map、batch、shuffle等操作。这里我们使用map对图像数据及标签进行变换处理，然后将处理好的数据集打包为大小为64的batch”。需要进一步了解学习map、batch、shuffle操作是干什么的，还有就是为什么要打包成大小为64的batch。

第七步和第八步打印数据集的shape和dypte。

至此完成数据集处理。

(2)网络构建

第九步，网络构建，是用于该平台构建神经网络的代码部分，看起来很简单，但是这些参数是干什么的还需要详细学习。根据官方介绍，“mindspore.nn类是构建所有网络的基类，也是网络的基本单元。当用户需要自定义网络时，可以继承nn.Cell类，并重写__init__方法和construct方法。__init__包含所有网络层的定义，construct中包含数据（Tensor）的变换过程”。对我来说这些方法以后只有详细学习神经网络再来进行重写和修改了。