最近写的行人重识别（person re-id）程序错误反思记录

最新推荐文章于 2022-11-25 18:17:53 发布

深度菜鸡-达闻西

最新推荐文章于 2022-11-25 18:17:53 发布

阅读量226

点赞数 1

分类专栏： PyTorch 行人重识别文章标签：深度学习多GPU并行运行程序 cuda

本文为博主所有，如有问题，联系本人，欢迎指正

本文链接：https://blog.csdn.net/qq_37405118/article/details/107543301

版权

行人重识别同时被 2 个专栏收录

33 篇文章 3 订阅

订阅专栏

PyTorch

15 篇文章 0 订阅

订阅专栏

文章目录

一、 Loss 问题
二、分层学习率问题
三、多GPU 处理程序

一、 Loss 问题

首先，loss 用的是三元组损失，标签平滑交叉熵损失，调试的过程中出了两个错误

（1） float，list dtype不一样的问题，问题出在了下边的 len(),忘了写了，导致class_names是一个列表，不是我们需要的长度。
在这里插入图片描述

在这里插入图片描述
（2） 维度不匹配

原因是出在了 train.py 训练程序里边的训练和验证环节（train和 val) net返回的特征不一样导致，所以出错。

二、分层学习率问题

一开始按照net（model）的模块名字写上去，这个思想是没问题的，但是因为太多了，导致复制粘贴重复了一次，导致出错。
在这里插入图片描述
要细心

三、多GPU 处理程序

os.environ['CUDA_VISIBLE_DEVICES'] = '0,1'
device_ids = [0, 1]
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

inputs = inputs.cuda()
labels = labels.cuda()



model = nn.DataParallel(model, device_ids=device_ids)
model = model.to(device)#先cuda

注意，分层不同学习率，需要加model.moudule.xxxx
在这里插入图片描述

深度菜鸡-达闻西

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
最近写的行人重识别（person re-id）程序错误反思记录

文章目录一、 Loss 问题二、分层学习率问题三、多GPU 处理程序一、 Loss 问题首先，loss 用的是三元组损失，标签平滑交叉熵损失，调试的过程中出了两个错误（1） float，list dtype不一样的问题，问题出在了下边的 len(),忘了写了，导致class_names是一个列表，不是我们需要的长度。（2）维度不匹配原因是出在了 train.py 训练程序里边的训练和验证环节（train和 val) net返回的特征不一样导致，所以出错。二、分层
复制链接

扫一扫