一、 mmlab环境搭建
(1)opemmmlab 软件库
(2)简单网络代码介绍以及训练过程
一般pytorch代码步骤定义网络、数据载入、损失函数、训练函数、测试函数,而openmmlab利用configs文件实现代码训练
a.配置文件介绍1、模型配置2、数据读入以及数据增强
b.水果数据集分类项目
1、数据集下载
2、配置文件修改:分类头数量改为30,微调预训练模型加载,配置数据集路径、
二、超算平台使用
1、创建平台账号,进入分区
2、生成anaconda环境,利用指令module avail使用conda,指令为module anaconda/2021.05
3、conda create --name mmclassfication python=3.8 创建python环境
4、配置项目所需的环境安装pytorch、mmcv等、利用module load cuda/11.1
5、配置正确的gcc版本(7.3)
6、cat run.sh(运行指令作业脚本)
7、提交计算batch --gpu=1 run.sh,parajobs
8、ssh 节点进入gpu
9、输出日志ls -lh \slurm-202136.out
ls work/(查看输出)