resnet152训练_Resnet-152的图像预处理

最新推荐文章于 2024-06-07 09:55:11 发布

weixin_39743511

最新推荐文章于 2024-06-07 09:55:11 发布

阅读量1.3k

点赞数

文章标签： resnet152训练

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39743511/article/details/111749692

版权

本文详细介绍了ResNet-152模型在训练前对图像的预处理步骤，包括等比例尺寸调整、随机裁剪、水平翻转、归一化以及颜色抖动。通过这些操作，将原始图片转化为适合ResNet-152模型输入的224*224尺寸，并使用数据增强提升模型的泛化能力。

摘要由CSDN通过智能技术生成

152层的 Resnet的图片输入尺寸为224*224，那对于大多数情况，图片的分辨率都是大于这个数值，那么该如何把图片的尺寸裁剪到这样一个尺寸，又如何进行数据增强呢？

第一，调整尺寸(Rescaling)

先将图片较短的那条边，随机缩放到[256,480]这样一个范围内。注意，此时的图片是等比例缩放的。举个例子，原始图片的尺寸为[1000,800,3]，假设图片短边缩放到256，那么此时图片的尺寸即为[320,256,3]，即图片的长宽比例是不变的。

第二，裁剪(Cropping)

将图片进行水平翻转，然后从原图片和翻转后的图片中，随机裁剪出224*224的图片。那到底裁几张呢？Resnet没有明说。。。我觉得还是看自己计算机的配置。因为从理论上来说，假设裁剪过后的图片尺寸为[256,256,3]，如果按照步长为1，最多可以裁剪出(256-224)*(256-224) = 1024张，再加上水平翻转的图片，还要乘以个2，也就是2048张图片。一张图片扩展了2048倍，肯定是非常夸张了，那所以，我的做法是随机裁剪个10张，就差不多了。

第三，归一化(Normalizing)

具体做法就是对于整个训练集图片，每个通道分别减去训练集该通道平均值。

第四，颜色抖动(color shifting)

这里resnet 引用的是Alexnet 2012年提出的做法，对于每张图片，每个通道的数据先由二维转成一维(例如256*256*3，转成65536*3)，再对该图片(65536*3)三个通道求出协方差矩阵(

最低0.47元/天解锁文章

weixin_39743511

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
resnet152训练_Resnet-152的图像预处理

152层的 Resnet的图片输入尺寸为224*224，那对于大多数情况，图片的分辨率都是大于这个数值，那么该如何把图片的尺寸裁剪到这样一个尺寸，又如何进行数据增强呢？第一，调整尺寸(Rescaling)先将图片较短的那条边，随机缩放到[256,480]这样一个范围内。注意，此时的图片是等比例缩放的。举个例子，原始图片的尺寸为[1000,800,3]，假设图片短边缩放到256，那么此时图片的尺寸即...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。