华为Ascend众智计划项目--3DMPPE_ROOTNET--Pytorch模型迁移至NPU（一）

最新推荐文章于 2025-03-21 13:51:59 发布

麻烦给我点一份黄焖鸡

最新推荐文章于 2025-03-21 13:51:59 发布

阅读量3k

点赞数

分类专栏：华为-Ascend 文章标签： pytorch 华为深度学习 python

本文链接：https://blog.csdn.net/KingGugu/article/details/120732803

版权

华为-Ascend 专栏收录该内容

5 篇文章

订阅专栏

本文档详细记录了将3D姿态估计模型3DMPPE_ROOTNET从Pytorch迁移到华为昇腾NPU的全过程，包括本地GPU复现、NPU环境配置、模型精度与性能调优等步骤。在本地GPU环境中，使用Pytorch1.7.0、CUDA10.1和cuDNN8.0.5进行单卡训练，解决了一系列环境配置问题，最终达到预期精度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

系列文章目录

项目信息、本地GPU单卡复现：
华为Ascend众智计划项目–3DMPPE_ROOTNET–Pytorch模型迁移至NPU（一）

模型迁移——本地代码添加：
华为Ascend众智计划项目–3DMPPE_ROOTNET–Pytorch模型迁移至NPU（二）

模型迁移——服务器GPU-2P调试和NPU单卡调试：
华为Ascend众智计划项目–3DMPPE_ROOTNET–Pytorch模型迁移至NPU（三）

模型迁移——NPU单P性能和精度调优：
华为Ascend众智计划项目–3DMPPE_ROOTNET–Pytorch模型迁移至NPU（四）

模型迁移——NPU-8P调试：
华为Ascend众智计划项目–3DMPPE_ROOTNET–Pytorch模型迁移至NPU（五）

前言

本系列文章记录笔者在完成华为昇腾众智项目的主要过程、遇到的问题及解决方案等。Ascend 众智计划是华为围绕 Ascend 基础软件平台推出的一项生态合作计划，旨在汇聚高校、科研院所、企业等组织和机构的开发团队，通过项目合作方式，基于 Ascend 基础软硬件平台开发算子、网络模型及行业参考设计，不断丰富 Ascend 计算产业生态，为加速千行百业智能化升级贡献智慧与力量。笔者负责的是姿态识别模型3DMPPE_ROOTNET的训练任务，该模型是基于Pytorch框架实现的。

一、项目信息

1.项目简介

模型名：3DMPPE_ROOT NET
算法场景：3D 姿态估计
论文链接：https://arxiv.org/abs/1907.11346
代码链接：https://github.com/mks0601/3DMPPE_ROOTNET_RELEASE
目标配置：RootNet
参考精度：~~MRPE120.0~~ MuCo
目标数据集：~~Human3.6M~~ AP_25（percentage）31.0
因为Human3.6M数据集过大，经过讨论后最终将训练数据集换为MuCo（3D数据集）和MPII（2D数据集），测试数据集为MuPoTS，参考精度也改为MuCo数据集的参考精度。作者提供了多个可供训练和测试的数据集，每次训练需要至少一个3D数据集和一个2D数据集，测试数据集也需要与训练数据集对应。具体可参阅代码中的md文件。

2.环境信息

Python 3.6.5
Pytorch 1.5.0（华为NPU所使用的Pytorch版本）
其余GPU环境复现时安装对应版本的Pytorch、CUDA、cuDNN，可以跑通即可。
pytorch + cuda + cudnn 配置完整教程

3.训练阶段里程碑

Step 0: 本地模型调试
Step 1: 1 卡 GPU 精度和性能复现
Step 2: 8 卡 GPU 精度和性能复现
Step 3: 1 卡 NPU 精度和性能对齐
Step 4: 8 卡 NPU 精度和性能对齐

二、本地GPU单卡复现

1.下载数据集

训练数据集选用的是MuCo和MPII，测试数据集为MuPoTS。参考代码中的MD文件下载所需数据集和JSON文件。

2.本地运行

本地运行相对来说较为简单，只要能跑通作者所提供的的代码，并且达到论文中的精度即可。
本地运行时主要遇到的还是环境方面的问题，如缺少提示缺少“cv2”，解决方案：
pip install opencv-python
另外在安装pycocotools时，遇到了C++环境编译的问题，尝试安装Visual Studio后仍然无法解决，报错如下：
command ‘ cl.exe‘ failed: No such file or directory
最后的解决方案可以看这篇博客。
command ‘ cl.exe‘ failed: No such file or directory 问题的另一种解决办法
GPU单卡的运行环境是：
Pytorch 1.7.0
CUDA 10.1
cuDNN 8.0.5（.h文件的版本显示好像存在问题，具体可以可以跑通即可）
本地运行的GPU为2080S，一次训练需要20个epoch，原文作者使用两张1080ti花费了两天时间。