【1】kaggle竞赛:狗的种类识别(基于pytorch内置函数实现VGG/ResNet)

该博客详细介绍了如何使用PyTorch进行Kaggle狗类识别竞赛的数据预处理,包括图像的拆分、预处理、VGG和ResNet模型的构建、训练与测试。数据预处理涉及了图像的随机裁剪、水平翻转、亮度调整等。训练部分使用了交叉熵损失函数,优化器为SGD,同时应用了学习率调度器。测试阶段,利用训练好的模型对测试集进行分类并保存结果。
摘要由CSDN通过智能技术生成

1.加载数据集及处理

使用torch.utils.data.DataLoader类创建数据加载器,对数据集进行预处理,将原始训练集中的图像按照指定的验证集比例 0.1 进行拆分,生成训练集和验证集,并将图像移动到按狗的种类分组的子文件夹中。将测试集中的图像也移动到按狗的种类分组的子文件夹中,完成数据集的预处理。

2.图像预处理

使用torchvision库中的图像预处理函数来对训练集和验证集的图像进行预处理。训练集:随机裁剪图像,所得图像为原始面积的0.08到1之间,高宽比在3/4和4/3之间,随机水平翻转图像,随机更改亮度、对比度和饱和度,添加随机噪声,并将图像转换成tensor形式,作为模型的输入,标准化图像的每个通道,使用预先计算好的均值和标准差,将图像的像素值归一化到固定范围。测试集:调整图像大小为256x256,保持图像的宽高比,从图像中心裁剪224x224大小的图片,保留图像的中心区域,确保输入模型的图像大小一致,添加随机噪声,并将图像转换成tensor形式,作为模型的输入,标准化图像的每个通道,使用预先计算好的均值和标准差。

3.定义网络模型(VGG11/ResNet18)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小镇躺不平家

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值