Re-id的trick技巧

最新推荐文章于 2023-05-15 13:33:32 发布

乘风破浪的炼丹师-Sunfine

最新推荐文章于 2023-05-15 13:33:32 发布

阅读量244

点赞数

分类专栏： Re-ID；重识别随笔计算机视觉竞赛方案

本文链接：https://blog.csdn.net/qq_17403617/article/details/108566156

版权

Re-ID；重识别同时被 3 个专栏收录

16 篇文章 25 订阅 ¥9.90 ¥99.00

订阅专栏

随笔

14 篇文章 0 订阅

订阅专栏

计算机视觉竞赛方案

8 篇文章 3 订阅

订阅专栏

本文分享了深度学习在人脸识别和行人重识别领域的若干技巧，包括训练时的数据增强策略（如水平翻转、随机擦除），网络结构优化（如去除下采样、调整BN层参数），以及模型训练调优方法（如学习率衰减策略、无偏移量BatchNorm）。这些技巧旨在提高模型性能，减少过拟合，保留更多细节信息。

摘要由CSDN通过智能技术生成

1.主要采用训练时水平翻转，测试时也同样水平翻转抽取两次特征并求平均。该思路在人脸识别问题中就被大量采用。
2.输入图像扩大，来自[3]中，将256128的输入变为384128，性能会提升不少，也有人尝试288144[4]
3.随机裁剪，很多人尝试过后会发现性能反而不好，这里有个技巧，就是先补0，然后再裁剪，把图片resize到384128，然后补0至402148，再次随机裁剪为384128。具体做法来自于[5]，该文章中是把图片resize到256128，并补0至276148，然后随机裁减至256*128。我个人的理解是这样既能减少图片过多裁减的信息丢失，又能通过黑边补全减少过拟合。
4.随机擦除，random erasing，通过随机擦除图中的一部分方形区域，减少模型过拟合的情况，具体来自于文章[7]中。
5.根据bag of tricks for image classfication 论文，batch size 扩大几倍，原始lr 就要增加几倍。提出从0开始的warm up 理论。
6…根据bag of tricks for image classfication 论文，每个残差块的最后一个BN层的γ参数初始化为0，我们知道BN层的γ、β参数是用来对标准化后的输入做线性变换的，也就是γx

了解本专栏

乘风破浪的炼丹师-Sunfine

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Re-id的trick技巧

1.主要采用训练时水平翻转，测试时也同样水平翻转抽取两次特征并求平均。该思路在人脸识别问题中就被大量采用。2.输入图像扩大，来自[3]中，将256128的输入变为384128，性能会提升不少，也有人尝试288144[4]3.随机裁剪，很多人尝试过后会发现性能反而不好，这里有个技巧，就是先补0，然后再裁剪，把图片resize到384128，然后补0至402148，再次随机裁剪为384128。具体做法来自于[5]，该文章中是把图片resize到256128，并补0至276148，然后随机裁减至256*128
复制链接

扫一扫