本章节介绍在昇腾上训练模型的过程,从迁移、适配、训练、到最后的推理验证,并基于开发板验证训练&推理全过程。
手写体识别
数据集收集
设计模型
我们的目标是识别图片中的数字,这是典型的分类问题。因此我们采用卷积神经网络(CNN)去实现这一功能。数字本身特征较少,我们只需简单堆叠两层卷积层便可满足这一任务目标的需求。我们设计的网络代码如下:
Pytorch训练基本流程介绍
预处理定义
关键组件定义
训练执行
训练执行
Pytorch训练迁移
将基于PyTorch的训练脚本迁移到昇腾AI处理器上进行训练,目前有以下3种方式:
自动迁移、工具迁移、手工迁移。且迁移前要保证该脚本能在GPU、CPU上运行。