opengait代码运行之gaitedge 未完成版

云霄星乖乖的果冻

已于 2024-05-20 13:40:23 修改

阅读量889

点赞数 16

分类专栏： opengait 文章标签： pytorch 人工智能 python

于 2024-05-06 21:49:14 首次发布

本文链接：https://blog.csdn.net/qq_39991776/article/details/138507520

版权

opengait 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

文章目录

前言
注意！代码中需要改的点
- torch.distributed.init_process_group('nccl', init_method='env://')
一、下载源代码
二、配置环境——pycharm,pytorch等
- 1.pycharm虚拟环境设置
- 2.下载相应的包
三、下载数据集
四、下载模型
- 1.第一种方式
- 2.第二种方式
五、开始训练

前言

本次任务为运行opengait代码。主要侧重于gaitedge，需要用到的数据集为CASIA-B*。

注意是带有星号的数据集，不然跑第二个配置文件时会报错！

电脑配置：
windows
带有1个GPU

注意！代码中需要改的点

这部分比较重要，所以，放在最前面，而不按照运行顺序

torch.distributed.init_process_group(‘nccl’, init_method=‘env://’)

如果是windows的话，这个要改为torch.distributed.init_process_group('gloo')

ncll好像只能在linux上运行

一、下载源代码

OpenGait页面

点击上方链接后，就进入了github中opengait所在位置

点击绿色按钮，然后点击Download ZIP，下载代码，然后用pycharm打开

二、配置环境——pycharm,pytorch等

1.pycharm虚拟环境设置

注意python版本不能太高，我的是3.6版本

pytorch版本为1.10.2，torchvision版本为0.11.3

稍微具体一点来说，首先需要在pycharm里配置文件的解释器，选择虚拟环境中的python.exe

2.下载相应的包

官方命令为：

conda install tqdm pyyaml tensorboard opencv kornia einops -c conda-forge
conda install pytorch==1.10 torchvision -c pytorch

应该还需要下载opencv，py7zr等包

注意setuptools的版本不能太高，最好为58.04版本

pillow的版本应该为9.5.0

三、下载数据集

CASIA-B*数据集需要通过邮箱申请

下载好后，记下数据集存放的路径

然后运行命令：

python datasets/pretreatment.py --input_path CASIA-B --output_path CASIA-B-pkl

即用pretreanment.py文件对数据集进行预处理

注意，–input_path后面为下载好的数据集的存放路径，–output_path后为存放预处理后的数据集的路径，我用的是./dataset/CASIA-B-pkl

这个预处理会调整数据存放的结构，将数据集都变成.pkl文件

四、下载模型

1.第一种方式

官方给的命令为：
python misc/download_pretrained_model.py

2.第二种方式

如果以上命令行运行失败，还可以用第二种方式，即去到release页面，下载需要的模型。

要下载那些模型，存放到哪里呢？
可以查看misc/download_pretrained_model.py文件：

if __name__ == “__main__”:
urls = [
“https://github.com/ShiqiYu/OpenGait/releases/download/v1.0/pretrained_casiab_model.zip”,
“https://github.com/ShiqiYu/OpenGait/releases/download/v1.1/pretrained_oumvlp_model.zip”,
“https://github.com/ShiqiYu/OpenGait/releases/download/v1.1/pretrained_grew_model.zip”]
for url in urls:
download_file_and_uncompress(
url=url, extrapath=‘output’)
gaitgl_grew = [‘https://github.com/ShiqiYu/OpenGait/releases/download/v1.1/pretrained_grew_gaitgl.zip’,
‘https://github.com/ShiqiYu/OpenGait/releases/download/v1.1/pretrained_grew_gaitgl_bnneck.zip’]
for gaitgl in gaitgl_grew:
download_file_and_uncompress(
url=gaitgl, extrapath=‘output/GREW/GaitGL’)
print(“Pretrained model download success!”)

由此，可以得出，前三个模型要放到output文件夹下，后面两个模型放在output/CREW/GaitGL文件夹下，具体结构如下：

在这里插入图片描述

五、开始训练

官方给的命令为：

CUDA_VISIBLE_DEVICES=0,1 python -m torch.distributed.launch --nproc_per_node=2 opengait/main.py --cfgs ./configs/baseline/baseline.yaml --phase train

由于分布式训练会报错（目前还未解决），所以去掉了CUDA_VISIBLE_DEVICES=0,1 等分布式训练部分

由于launch过时，所以改为了run：

python -m torch.distributed.run opengait/main.py --cfgs 这里放要跑的配置文件的路径 --phase train