华为Ascend众智计划项目--3DMPPE_ROOTNET--Pytorch模型迁移至NPU(一)

系列文章目录

项目信息、本地GPU单卡复现:
华为Ascend众智计划项目–3DMPPE_ROOTNET–Pytorch模型迁移至NPU(一)

模型迁移——本地代码添加:
华为Ascend众智计划项目–3DMPPE_ROOTNET–Pytorch模型迁移至NPU(二)

模型迁移——服务器GPU-2P调试和NPU单卡调试:
华为Ascend众智计划项目–3DMPPE_ROOTNET–Pytorch模型迁移至NPU(三)

模型迁移——NPU单P性能和精度调优:
华为Ascend众智计划项目–3DMPPE_ROOTNET–Pytorch模型迁移至NPU(四)

模型迁移——NPU-8P调试:
华为Ascend众智计划项目–3DMPPE_ROOTNET–Pytorch模型迁移至NPU(五)


前言

  本系列文章记录笔者在完成华为昇腾众智项目的主要过程、遇到的问题及解决方案等。Ascend 众智计划是华为围绕 Ascend 基础软件平台推出的一项生态合作计划,旨在汇聚高校、科研院所、企业等组织和机构的开发团队,通过项目合作方式,基于 Ascend 基础软硬件平台开发算子、网络模型及行业参考设计,不断丰富 Ascend 计算产业生态,为加速千行百业智能化升级贡献智慧与力量。笔者负责的是姿态识别模型3DMPPE_ROOTNET的训练任务,该模型是基于Pytorch框架实现的。



一、项目信息

1.项目简介

模型名:3DMPPE_ROOT NET
算法场景:3D 姿态估计
论文链接:https://arxiv.org/abs/1907.11346
代码链接:https://github.com/mks0601/3DMPPE_ROOTNET_RELEASE
目标配置:RootNet
参考精度 :MRPE120.0   MuCo
目标数据集:Human3.6M  AP_25(percentage)31.0
因为Human3.6M数据集过大,经过讨论后最终将训练数据集换为MuCo(3D数据集)和MPII(2D数据集),测试数据集为MuPoTS,参考精度也改为MuCo数据集的参考精度。作者提供了多个可供训练和测试的数据集,每次训练需要至少一个3D数据集和一个2D数据集,测试数据集也需要与训练数据集对应。具体可参阅代码中的md文件。

2.环境信息

Python 3.6.5
Pytorch 1.5.0(华为NPU所使用的Pytorch版本)
其余GPU环境复现时安装对应版本的Pytorch、CUDA、cuDNN,可以跑通即可。
pytorch + cuda + cudnn 配置完整教程

3.训练阶段里程碑

  • Step 0: 本地模型调试
  • Step 1: 1 卡 GPU 精度和性能复现
  • Step 2: 8 卡 GPU 精度和性能复现
  • Step 3: 1 卡 NPU 精度和性能对齐
  • Step 4: 8 卡 NPU 精度和性能对齐

4.相关参考网站和文档

昇腾社区
Ascend:昇腾万里,让智能无所不及
Pytorch训练指导 - Wiki - Gitee.com
深度学习框架:Pytorch3 (基于 Pytorch 1.5.0)
PyTorch&ONNX众智一站式导航

二、本地GPU单卡复现

1.下载数据集

训练数据集选用的是MuCo和MPII,测试数据集为MuPoTS。参考代码中的MD文件下载所需数据集和JSON文件。

2.本地运行

  • 本地运行相对来说较为简单,只要能跑通作者所提供的的代码,并且达到论文中的精度即可。

  • 本地运行时主要遇到的还是环境方面的问题,如缺少提示缺少“cv2”,解决方案:
    pip install opencv-python

  • 另外在安装pycocotools时,遇到了C++环境编译的问题,尝试安装Visual Studio后仍然无法解决,报错如下:
    command ‘ cl.exe‘ failed: No such file or directory
    最后的解决方案可以看这篇博客。
    command ‘ cl.exe‘ failed: No such file or directory 问题的另一种解决办法

  • GPU单卡的运行环境是:
    Pytorch 1.7.0
    CUDA 10.1
    cuDNN 8.0.5(.h文件的版本显示好像存在问题,具体可以可以跑通即可)
    本地运行的GPU为2080S,一次训练需要20个epoch,原文作者使用两张1080ti花费了两天时间。


总结

本文介绍了项目信息和本地复现论文代码的情况。


参考文献

https://www.hiascend.com/ecosystem/all-wisdom

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要在华为NPU上安装conda,可以按照以下步骤进行操作: 1. 首先,连接到华为提供的NPU服务器,例如使用Xshell或其他远程连接工具。 2. 登录服务器后,创建自己的文件夹,用于安装和管理conda环境。 3. 接下来,复制一份pt-1.5的conda环境,可以使用命令`conda create -n your_env_name --clone pt-1.5`,这将创建一个与pt-1.5环境相同的新环境。 4. 安装所需的包,可以使用命令`conda activate your_env_name`激活新环境,然后使用`conda install package_name`安装需要的包。 5. 在设置好环境并安装完所需的包后,可以运行自己的程序。确保先激活自己的conda环境,使用命令`source env_npu.sh`,然后运行你的代码。 6. 另外,建议使用nohup命令后台运行代码,以确保代码可以持续运行。可以使用`nohup python your_code.py &`命令来运行代码。 7. 在运行代码后,可能会生成许多日志文件。为了方便访问和修改,建议将运行代码的sh脚本文件放在单独的文件夹中,这样在使用WinSCP等工具进行访问时会更加方便。 这是一个大致的步骤,你可以根据具体情况适当调整。通过这些步骤,你可以在华为NPU上成功安装conda并运行代码。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [华为Ascend众智计划项目--3DMPPE_ROOTNET--Pytorch模型迁移NPU(三)](https://blog.csdn.net/KingGugu/article/details/120738467)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值