pytorch中的transforms模块

最新推荐文章于 2024-09-14 23:58:46 发布

gaishi_hero

最新推荐文章于 2024-09-14 23:58:46 发布

阅读量3.7k

点赞数 2

分类专栏： pytorch 文章标签： pytorch transforms ToTensor Normalize

本文链接：https://blog.csdn.net/gaishi_hero/article/details/81153926

版权

pytorch中的transforms模块中包含了很多种对图像数据进行变换的函数，这些都是在我们进行图像数据读入步骤中必不可少的，下面我们讲解几种最常用的函数，详细的内容还请参考pytorch官方文档（放在文末）。

data_transforms = transforms.Compose([
        transforms.RandomResizedCrop(224),
        transforms.RandomHorizontalFlip(),
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
    ])

从上面的data_transforms变量中我们能够看出进行了多种变换，而Compose方法是将多种变换组合起来。data_transforms中一共包含了四个变换，前两个是对PILImage进行的，分别对其进行随机大小（默认原始图像大小的0.08-1.0）和随机宽高比（默认原始图像宽高比的3/4-4/3）的裁剪，之后resize到指定大小224；以及对原始图像进行随机（默认0.5概率）的水平翻转。

第三个transforms.ToTensor()的变换操作是关键一步，它将PILImage转变为torch.FloatTensor的数据形式，这种数据形式一定是C x H x W的图像格式加上[0,1]的大小范围。它将颜色通道这一维从第三维变换到了第一维。

最