免费GPU线上跑AI项目实践（猫狗识别）

最新推荐文章于 2024-06-01 11:57:29 发布

__如果

最新推荐文章于 2024-06-01 11:57:29 发布

阅读量294

点赞数 1

文章标签：人工智能

本文链接：https://blog.csdn.net/m0_73202283/article/details/133190303

版权

声明：

本文内容来自于对DataWhale的开源学习项目——免费GPU线上跑AI项目实践的学习，引用了多处DataWhale给出的教程

学习简介：

学习背景：

免费GPU线上跑AI项目实践可以让学习者通过实际操作，深入理解AI的工作原理和实现方式，提升自己的技术水平。同时，由于GPU具有强大的并行计算能力，使得AI模型的训练速度大大提升，这对于学习者来说，也是一个提升技术能力的好机会。通过免费GPU线上跑AI项目实践，学习者可以亲身体验到AI项目的开发流程，了解到理论知识在实践中的应用，从而增强自己的实践意识。

学习教程：

（1）注册趋动云账号，DataWhale的专属链接我不知道能不能放......DataWhale的学习者是可以免费领取168元算力金的

趋动云https://account.virtaicloud.com/gemini_web/auth/login

（2）获取官方代码文件（猫狗识别）：https://security.feishu.cn/link/safety?target=https%3A%2F%2Fgemvideo.blob.core.chinacloudapi.cn%2Fdocument%2FdogsVsCatsCode.zip&scene=ccm&logParams=%7B%22location%22%3A%22ccm_default%22%7D&lang=zh-CN

（3）创建项目：

进入趋动云用户工作台，在当前空间处选择注册时系统自动生成的空间（其他空间无免费算力）；
填写项目名称及项目描述；
添加镜像：选择含 TensorFlow 2.x 框架的官方镜像即可；
添加绑定数据集：选择公开数据集，DogsVsCats。
其余无需填写，点击右下角创建，系统弹出 上传代码 的提示，单击 暂不上传，项目创建成功。

（4）准备代码：

单击上传文件图标将获取的 DogsVsCats.py 文件上传至项目中

（5）初始化开发环境：

单击右上角的 运行代码，进入 初始化开发环境 页
填写开发环境的初始化配置

（6）调试代码：

1.单击 开发环境实例 页右侧的 JupyterLab 工具

2.默认进入 /gemini/ 目录下，在右侧目录树中单击 code 文件夹，进入到 /gemini/code/ 目录下

3.单击顶部 网页终端 按钮，进入终端界面

4.在网页终端运行如下代码

python  $GEMINI_RUN/DogsVsCats.py --num_epochs 5 --data_dir $GEMINI_DATA_IN1/DogsVsCats/ --train_dir $GEMINI_DATA_OUT

系统返回一系列信息，直到返回 test accuracy 信息，如下所示，表明该模型测试结束，其识别猫狗的能力为 0.500000，即几乎无识别能力。

5.单击 JupyterLab，切换回 JupyterLab 工具，分析 /gemini/code/ 路径下的模型代码。经排查，发现代码中没有打乱数据集进行训练，导致模型没有训练成功。这是因为模型在一个batch之中，只能看到猫的类别和狗的类别，这样看不到另一个类别的信息，所以没有任何识别能力。

额外补充：在机器学习中，特别是深度学习中，数据集的随机性是非常重要的。这是因为模型在学习过程中会尝试找到数据中的规律，而如果数据的顺序是固定的，那么模型就无法找到任何有用的规律。因此，我们需要对数据集进行打乱，使得数据的顺序是随机的，这样模型就有更多的机会学习到不同的规律，从而提高模型的识别能力。

6.修改代码：

双击 /gemini/code/ 路径下的 DogsVsCats.py ，开始编辑该文件。
删除该文件中第 44 行的注释符号 #。
按 “Crtl + S” 键，保存该文件。

7.单击 网页终端 按钮，进入终端界面再次执行上述 4 中的命令进行识别能力的测试。

（7）提交离线训练：

单击调试页面右上角的 提交训练任务。
在弹框中选择镜像和代码版本。
1. 选择代码版本：单击 新建代码版本，并在右边框中填写代码版本名。
2. 选择镜像：选择 直接使用当前工作镜像。
单击确定，进入 提交任务 页面。参考如下说明配置任务基本信息。

执行代码中的 DogsVsCats.py 脚本启动训练，训练所需数据为 $GEMINI_DATA_IN1/DogsVsCats 目录下的数据，训练结果保存在 $GEMINI_DATA_OUT 目录下。执行该任务的启动命令如下：
1. 配置说明，其余保持默认即可。
  1. 任务模型：单机任务；
  2. GPU选择：B1.meduim【需选择1Gpu的配置】
  3. 启动命令

python3 $GEMINI_RUN/DogsVsCats.py --num_epochs 5 --data_dir $GEMINI_DATA_IN1/DogsVsCats --train_dir $GEMINI_DATA_OUT

配置信息填写完成后，单击确定。

返回 训练任务 页面，在训练任务列表中查看该任务的状态，该任务大约 5 分钟即可训练完成。

任务状态显示为成功则表示训练任务成功结束。
任务状态为失败，可将鼠标悬置于失败字样上，查看失败原因。

（8）结果集存储与下载：

在左侧导航栏中选择结果，默认进入 任务结果 页面。
单击右上角的 导出模型 按钮，进入 导出模型 页面。
单击创建，生成模型。

生成的模型将保存在平台中，您可将其公开性设置为公开，并将其分享给其他成员使用或进一步完善模型。

__如果

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
免费GPU线上跑AI项目实践（猫狗识别）

免费GPU线上跑AI项目实践可以让学习者通过实际操作，深入理解AI的工作原理和实现方式，提升自己的技术水平。同时，由于GPU具有强大的并行计算能力，使得AI模型的训练速度大大提升，这对于学习者来说，也是一个提升技术能力的好机会。通过免费GPU线上跑AI项目实践，学习者可以亲身体验到AI项目的开发流程，了解到理论知识在实践中的应用，从而增强自己的实践意识。
复制链接

扫一扫