总结：multicrop的使用

最新推荐文章于 2025-02-15 17:23:55 发布

/home/liupc

最新推荐文章于 2025-02-15 17:23:55 发布

阅读量2.6k

点赞数 4

分类专栏： 11 Python/DL/ML

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pengchengliu/article/details/118856713

版权

本文介绍了FiveCrop()和TenCrop()在深度学习图像处理中的应用场景，特别是在测试阶段用于增强预测的准确性。文章讨论了为何在训练中不常用此技术，以及它们与常规transformer的区别。通过一个简单的TenCrop()使用示例，阐述了从图像预处理到网络输入的完整流程，包括结果的平均处理，以获取最终预测。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、FiveCrop()和TenCrop()的使用场景

目前我见到的场景，往往是在测试的时候，将一张图片裁剪成10张，然后分别对10张进行预测，再取平均值得到最后的预测结果。比如《5. 实验2：对预训练的AlexNet进行finetune，实现对猫狗数据集二分类》以及VGG的finetune代码中。

VGG的论文中也使用了multi-crop测试的技巧，不过它更夸张，一张图片裁剪成了150张。见《4. 论文精读2：训练技巧、测试技巧、实验结果、总结》

虽然说在训练的时候，为了增加数据量而进行multiCrop也可以，而且理论和首先上与测试阶段没什么区别，但是在实际使用中，我还没有遇到过。

二、为什么要单独讲FiveCrop()和TenCrop()？

因为如果使用了multiCrop()这个技巧，transformer的写法不一样。

而且，一般来说，一张图像经过transformer之后，得到的是C*H*W的三维张量；但是有了multiCrop之后，得到的是一个ncrops*C*H*W的思维向量。这就导致，需要经过特殊处理才能送入到网络中。而且得到的结果需要对ncrops取平均。

所以很多地方不怎么用这个技巧，因为写起来比较麻烦。这也就是要单独讲一下的原因。

<

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。