【OpenGait】启动tensorboard 查看训练过程

weixin_46135327

已于 2024-01-16 19:43:38 修改

阅读量693

点赞数 10

文章标签： python

于 2023-12-04 20:22:09 首次发布

本文链接：https://blog.csdn.net/weixin_46135327/article/details/134793101

版权

一、解决办法
OpenGait使用SummaryWriter来记录训练过程中的数据，这些数据可以通过TensorBoard可视化。要查看TensorBoard，你需要在训练开始前启动TensorBoard服务器，并指向保存TensorBoard日志的目录。使用以下命令启动TensorBoard：

tensorboard --logdir=<path_to_summary_directory>

然后在浏览器中打开TensorBoard提供的URL，通常是http://localhost:6006。
在这里插入图片描述
PS <path_to_summary_directory>指的是训练后得到的summary文件，具体地址：

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_46135327

关注关注

10
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

PyTorch可视化工具-Tensorboard在线查看训练曲线、网络结构图等

程序员，他们想的是什么?他们想的永远都是技术，他们崇尚的也永远都是技术。

11-02

3212

在反向传播后面，添加#输出loss writer.add_scalar。在模型初始化下面，添加#输出模型结构 writer.add_graph。这里要注意，如果cuda可用，要转换成cuda类型，否则用cpu模型。刷新网页，就可以看到历史版本曲线，可以选择要显示的版本，就行对比分析。这里batch=100，下面图片显示100个28*28的小图拼接而成。在前前向传播前面，添加#输出图像 writer.add_image。将历史生成的log,分别放在不同的文件夹里，每个文件件放一个，如图。

OpenGait 正式版1.0发布啦！

u010670887的博客

12-09

5136

OpenGait项目经过一个月的修改、精进、期间不断吸收社区反馈意见（反复跳票），正式的v1版本终于发布啦！这次更新包含两大块内容：丰富文档和支持OUMVLP数据集。网址：https://...

参与评论您还未登录，请先登录后发表或查看评论

使用Tensorboard查看训练过程(tf，2024大数据开发开发社招面试总结+解答分享

afagagagaa的博客

04-18

411

xs = tf.placeholder(tf.float32, [None, 1], name = ‘x_input’) # xs起名x_input，会在图形上显示。ys = tf.placeholder(tf.float32, [None, 1], name = ‘y_input’) # ys起名y_input，会在图形上显示。with tf.name_scope(‘Wx_plus_b’): #净输入。with tf.name_scope(‘Wx_plus_b’): #净输入。

训练和验证损失以及使用 TensorBoard 来查看 loss 曲线

一杯水果茶！足矣~

03-10

1637

训练和验证损失以及使用 TensorBoard 来查看 loss 曲线

查看Tensorboard

m0_68382801的博客

11-13

2031

查看Tensorboard

本地查看远程服务器上运行的 TensorBoard

qingqiufan的博客

07-29

447

如果端口正在使用中就更换端口。

tensorboard 查看训练过程（远程服务器）

学无止境

10-10

1738

tensorboard 查看训练过程（远程服务器）

opengait复现

最新发布

03-23

启动训练过程前，请确认超参数已合理调整完毕；随后利用如下命令开启正式训练： ```bash python train.py --config config.yaml ``` 其中 `--config` 参数指向具体的配置文件路径，该文件定义了网络结构、优化器...

opengait使用教程

02-08

训练的过程可能会花费一定的时间，取决于训练数据的大小和复杂程度。 4. 检测和识别人体姿势。训练完成后，用户可以使用opengait提供的API或者命令行工具，对新的人体行走动作进行检测和识别。用户可以将视频或者...

OpenGait-master

03-15

### 如何克隆或下载 OpenGait 的 master 分支 OpenGait 是一个开源项目，通常托管在代码共享平台（如 GitHub 或 Gitee...以上脚本可用于自动化执行 git 克隆过程，但需确保系统已正确设置好 Python 和 Git 路径变量。

从0开始深度学习——步态识别代码解读01如何用本地的GPU调试opengait框架？

qq_53536373的博客

12-10

1707

点击确定了以后会出现，如果没有以下的软件包，就点一下软件包旁边那个小绿圈就自动加载出来了，神奇的是python 解释器自动变为了E:\anaconda\envs\mypytorch\python.exe。接下来，将E:\anaconda\envs\mypytorch\Lib\site-packages\torch\distributed这个文件复制到项目目录下。文件——>设置——>项目——>python解释器——>添加解释器——>conda 环境——>需要查看自己的gpu版本步骤——cmd。

windows远程查看tensorboard可视化图形

12-21

windows系统在远程服务器上训练神经网络时，查看tensorboard可视化图形的方法

tensorboard的查看方法

lixiangohoh的博客

10-08

1478

关于tensorboard的查看方法首先版本是1.9的tensorflow,注意只有1版本有tensorboard 需要在设置一下端口根据这篇文章设置一下就好了链接: link. 方法在pycharm里面的输入一下代码这里报错也没有关系的不要直接点这个网址，一般会报错在浏览器中输入;http://127.0.0.1:6008/ 然后进入一下页面这里报错没有关系的啊！！然后切换至GRAPHS的选项卡里这里就可以看到图了 ...

使用tensorboard查看模型

zhu_ba的博客

08-20

589

在pytorch的环境下，安装tensorboard和tensorflow我安装在虚拟环境d2l中验证是否安装成功输入如上代码，如果没有报错，则代表安装成功。

win下怎么查看tensorboard

一只攻城狮的博客

02-13

4024

win下怎么查看tensorboard 在进行模型训练时，我们有时会使用回调函数tensorboard来可视化数据，本文介绍了在保存tensorboard运行文件后，该如何在win下查看可视化界面。第一种方法: 如果你安装了Anaconda,可以直接启动anaconda控制台窗口代码示例：运行命令：tensorboard --logdir= 保存文件的地址（图中绿色为我保存的文件地址...

如何查看tensorboard图

fs01234的博客

10-12

4624

1、在cmd窗口中激活tensorflow环境进入tensorflow环境路径 E:\Work_Softwares\venv\Scripts 激活环境 activate 效果如下： 2、输入命令，tensorboard --logdir=+文件夹路径出现如下提示： 3、在浏览器中输入：http://localhost:6006，即可查看到tensorboard图。 ...

Windows上查看服务器上tensorboad内容

weixin_48192256的博客

07-15

1780

本篇文章是针对于局域网内的服务器的tensorboard可视化，由于设置方式稍微有点复杂，导致我每次隔了一段时间之后，就不知道该怎么查看tensorboard了，每次都要百度搜一大堆资料，而且也不一定好使，在这里记录一下连接的方式。我使用的是Xshell7来进行的端口映射，当然tensorboard可视化的方式并不是只有这一种，这只是我认为的比较方便的一种连接。

tensorboard查看文件

lzay的博客

06-14

2074

Tensorboard使用

TensorBoard最全使用教程：看这篇就够了

热门推荐

qq_41656402的博客

06-09

10万+

TensorBoard最全使用教程：看这篇就够了

# Get Started ## Installation 1. clone this repo. ``` git clone https://github.com/ShiqiYu/OpenGait.git ``` 2. Install dependenices: - pytorch >= 1.10 - torchvision - pyyaml - tensorboard - opencv-python - tqdm - py7zr - kornia - einops Install dependenices by [Anaconda](https://conda.io/projects/conda/en/latest/user-guide/install/index.html): ``` conda install tqdm pyyaml tensorboard opencv kornia einops -c conda-forge conda install pytorch==1.10 torchvision -c pytorch ``` Or, Install dependenices by pip: ``` pip install tqdm pyyaml tensorboard opencv-python kornia einops pip install torch==1.10 torchvision==0.11 ``` ## Prepare dataset See [prepare dataset](2.prepare_dataset.md). ## Get trained model - Option 1: ``` python misc/download_pretrained_model.py ``` - Option 2: Go to the [release page](https://github.com/ShiqiYu/OpenGait/releases/), then download the model file and uncompress it to [output](output). ## Train Train a model by ``` CUDA_VISIBLE_DEVICES=0,1 python -m torch.distributed.launch --nproc_per_node=2 opengait/main.py --cfgs ./configs/baseline/baseline.yaml --phase train ``` - `python -m torch.distributed.launch` [DDP](https://pytorch.org/tutorials/intermediate/ddp_tutorial.html) launch instruction. - `--nproc_per_node` The number of gpus to use, and it must equal the length of `CUDA_VISIBLE_DEVICES`. - `--cfgs` The path to config file. - `--phase` Specified as `train`.  - `--log_to_file` If specified, the terminal log will be written on disk simultaneously. You can run commands in [train.sh](train.sh) for training different models. ## Test Evaluate the trained model by ``` CUDA_VISIBLE_DEVICES=0,1 python -m torch.distributed.launch --nproc_per_node=2 opengait/main.py --cfgs ./configs/baseline/baseline.yaml --phase test ``` - `--phase` Specified as `test`. - `--iter` Specify a iteration checkpoint. **Tip**: Other arguments are the same as train phase. You can run commands in [test.sh](test.sh) for testing different models. ## Customize 1. Read the [detailed config](docs/1.detailed_config.md) to figure out the usage of needed setting items; 2. See [how to create your model](docs/2.how_to_create_your_model.md); 3. There are some advanced usages, refer to [advanced usages](docs/3.advanced_usages.md), please. ## Warning - In `DDP` mode, zombie processes may be generated when the program terminates abnormally. You can use this command [sh misc/clean_process.sh](./misc/clean_process.sh) to clear them.

03-18

<think>嗯，用户这次给了一个关于OpenGait的安装和使用指南的文档，然后让我用中文介绍一下或者回答相关问题。看起来用户可能是想部署或者使用这个OpenGait项目，但可能遇到了问题，或者需要更详细的解释。首先，我需要先仔细阅读用户提供的文档内容，理解每个步骤的作用。用户之前问过关于Conda的错误，可能他现在在尝试安装依赖时遇到了问题，所以需要确保依赖安装正确。也可能他在训练或测试模型时遇到问题，需要帮助。接下来，用户提供的文档里有几个部分：安装、准备数据集、获取预训练模型、训练、测试、自定义和警告。我需要将这些内容用中文重新组织，确保结构清晰，步骤明确，并且符合用户之前提到的系统级指令，比如数学公式的格式，但这里可能不太涉及数学公式，主要是代码块和命令行指令。需要注意的是，用户可能对某些步骤不熟悉，比如分布式训练中的DDP模式，或者如何处理僵尸进程。所以解释的时候要尽量简明，但关键点要说清楚。比如在安装依赖时，使用conda和pip两种方式，可能需要提醒用户注意版本兼容性，特别是PyTorch的版本是否与CUDA匹配。另外，用户之前遇到的Conda错误可能与安装依赖有关，所以在解释安装步骤时，可能需要加入一些注意事项，比如如何避免环境冲突，或者如何正确使用conda-forge频道。同时，用户可能在数据集准备部分需要更多指导，文档里只是提到了一个链接，可能需要补充说明常见的数据集准备步骤或可能遇到的问题。还有，训练和测试命令中的参数解释需要清楚，比如CUDA_VISIBLE_DEVICES和nproc_per_node的关系，确保用户理解如何根据自己GPU的数量调整参数。自定义部分可能涉及配置文件的理解和模型构建，用户可能需要更多的指引，但文档里已经提供了链接，可能需要强调这些文档的重要性。最后，警告部分提到的僵尸进程问题，用户可能需要知道如何避免或处理这种情况，所以解释清理命令的作用和使用方法是必要的。总结下来，我需要将用户提供的英文指南转化为结构清晰的中文步骤说明，补充可能需要的注意事项，并确保代码块正确格式化。同时，考虑到用户可能的技术水平，避免使用过于专业的术语，保持解释的易懂性。此外，检查是否有潜在的坑，比如版本冲突、环境配置问题，给出相应的建议，帮助用户顺利完成OpenGait的安装和使用。</think>--- ### **OpenGait 快速入门指南** --- #### **1. 安装步骤** ##### **1.1 克隆代码仓库** ```bash git clone https://github.com/ShiqiYu/OpenGait.git ``` ##### **1.2 安装依赖项** **支持两种安装方式（任选其一）：** - **通过 Anaconda 安装（推荐）** 使用 Conda 管理环境可避免依赖冲突： ```bash # 安装基础依赖 conda install tqdm pyyaml tensorboard opencv kornia einops -c conda-forge # 安装 PyTorch 1.10 和对应版本的 torchvision conda install pytorch==1.10 torchvision -c pytorch ``` - **通过 pip 安装** 确保已安装兼容的 Python 环境（建议 Python 3.8+）： ```bash pip install tqdm pyyaml tensorboard opencv-python kornia einops pip install torch==1.10 torchvision==0.11 ``` **注意事项：** - 若使用 GPU，需提前安装与 PyTorch 1.10 匹配的 CUDA 驱动（推荐 CUDA 11.3）。 - 若安装失败，检查网络是否可访问 PyPI 或 Conda 源（国内用户可切换清华镜像）。 --- #### **2. 准备数据集** - 参考文档 [prepare_dataset.md](2.prepare_dataset.md)，按指引下载并预处理数据集（如 CASIA-B、OU-MVLP 等）。 - 确保数据集路径与配置文件中的 `dataset_root` 参数一致。 --- #### **3. 获取预训练模型** - **方式一（自动下载）**： ```bash python misc/download_pretrained_model.py ``` - **方式二（手动下载）**：访问 [Release 页面](https://github.com/ShiqiYu/OpenGait/releases/)，下载模型文件后解压到 `output` 目录。 --- #### **4. 模型训练** **单机多卡训练命令示例**： ```bash CUDA_VISIBLE_DEVICES=0,1 python -m torch.distributed.launch --nproc_per_node=2 opengait/main.py --cfgs ./configs/baseline/baseline.yaml --phase train ``` **参数解析**： - `CUDA_VISIBLE_DEVICES=0,1`：指定使用 GPU 0 和 1。 - `--nproc_per_node=2`：每个节点使用 2 个进程（需与 GPU 数量一致）。 - `--cfgs`：配置文件路径（如 `baseline.yaml`）。 - `--phase train`：指定训练模式。 **其他选项**： - 使用 `--log_to_file` 可将日志保存到文件。 - 直接运行 [train.sh](train.sh) 脚本可快速启动不同模型的训练。 --- #### **5. 模型测试** **评估模型性能**： ```bash CUDA_VISIBLE_DEVICES=0,1 python -m torch.distributed.launch --nproc_per_node=2 opengait/main.py --cfgs ./configs/baseline/baseline.yaml --phase test --iter 100000 ``` **关键参数**： - `--phase test`：指定测试模式。 - `--iter 100000`：加载第 10 万次迭代的模型权重。 --- #### **6. 自定义配置与模型** 1. **配置文件详解** 阅读 [detailed_config.md](docs/1.detailed_config.md) 了解如何调整超参数（如学习率、数据集路径等）。 2. **自定义模型** 参考 [how_to_create_your_model.md](docs/2.how_to_create_your_model.md) 添加新网络结构。 3. **高级功能** 如多机训练、混合精度训练等，详见 [advanced_usages.md](docs/3.advanced_usages.md)。 --- #### **7. 常见问题与警告** - **僵尸进程清理** 若训练异常终止导致进程残留，运行以下命令清理： ```bash sh misc/clean_process.sh ``` - **DDP 模式兼容性** 确保 PyTorch 版本与 CUDA 驱动匹配，避免分布式训练失败。 --- ### **操作验证** - **依赖安装检查** 运行 `python -c "import torch; print(torch.__version__)"` 应输出 `1.10.x`。 - **训练启动验证** 执行训练命令后，检查终端是否正常输出损失值和进度条。 --- ### **扩展支持** - 若遇到环境配置问题，可尝试使用 Docker 镜像（需自行构建）。 - 详细文档参考 [OpenGait Wiki](https://github.com/ShiqiYu/OpenGait/wiki)。