ViT模型实现-数据处理

ZhangJiQun&MXP

于 2024-04-03 21:01:27 发布

阅读量166

点赞数 1

分类专栏：教学 2021 AI python 文章标签： python 开发语言

本文链接：https://blog.csdn.net/qq_38998213/article/details/137354399

版权

教学同时被 2 个专栏收录

1368 篇文章 ¥199.90 ¥299.90

订阅专栏

2021 AI python

958 篇文章 ¥199.90 ¥299.90

订阅专栏

本文介绍了如何使用PyTorch和torchvision对图像进行预处理，包括转换PIL图像和NumPy数组为torch.Tensor，以及数据增强。详细解释了预处理流程中的每个步骤，如调整大小、随机裁剪、水平翻转和归一化。还讨论了torchvision库的作用，以及如何在训练和测试模式下进行不同的预处理。最后，展示了如何从图像路径获取标签并进行预处理，为ViT模型训练准备数据。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

ViT模型实现

将PIL图像或NumPy ndarray转换为torch.Tensor

torchvision是什么

img.convert("RGB"): 这一行确保图像是RGB格式的

python字典

label_map

ViT模型实现

数据说明：

fruits: banana, apple, pear, grapes, orange, kiwi, watermelon, pomegranate, pineapple, mango
vegetables: cucumber, carrot, capsicum, onion, potato, lemon, tomato, raddish, beetroot, cabbage, lettuce, spinach, soy bean, cauliflower, bell pepper, chilli pepper, turnip, corn, sweetcorn, sweet potato, paprika, jalepeño, ginger, garlic, peas, eggplant

三个文件夹train、test、validation

train: 每类100张图片
test: 每类10张图片
validation: 每类10张图片

# 读取数据集
import paddle
import paddle.nn as nn
import os
from PIL import Image
import numpy as np
import padd

了解本专栏