【深度学习图像处理】使用Kornia来更好的展示transform之后的图片

Dou_Huanmin

已于 2024-05-21 21:06:50 修改

阅读量219

点赞数 1

分类专栏：深度学习图像检索（Image Retrieval）文章标签：深度学习图像处理人工智能

于 2024-05-21 21:06:12 首次发布

本文链接：https://blog.csdn.net/douhuanmin123/article/details/139102180

版权

深度学习同时被 2 个专栏收录

12 篇文章 0 订阅

订阅专栏

图像检索（Image Retrieval）

5 篇文章 0 订阅

订阅专栏

文章目录

Kornia介绍
模块实例
数据读取
使用numpy，matplotlib来可视化
效果展示

Kornia介绍

kornia是一个计算机视觉算法库，数据增强的模块非常好用，可以使用它的数据增强模块完全无缝的嵌入到pytorch中而且不会和torchvision中的transforms模块冲突

以下展示我们的数据增强模块的实例

模块实例

import torchvision.io as torchio
import torch
import torch.nn as nn 
import kornia.augmentation as Kg
from loguru import logger
import torch
import os
from augmentation import *
import glob
import torchvision
from torchvision import datasets, transforms
from PIL import Image
from matplotlib import pyplot as plt

class Augmentation(nn.Module):
    def __init__(self,org_size,Aw=1.0, *args, **kwargs) -> None:
        super(Augmentation,self).__init__(*args, **kwargs)
        self.gk = int(org_size * 0.1)
        
        if self.gk % 2 == 0 :
            self.gk += 1
            
        self.aug = nn.Sequential(
            Kg.RandomResizedCrop(size=(org_size, org_size), p=1.0*Aw),
            Kg.RandomHorizontalFlip(p=0.5*Aw),
            Kg.ColorJitter(brightness=0.4, contrast=0.8, saturation=0.8, hue=0.2, p=0.8*Aw),
            Kg.RandomGrayscale(p=0.2*Aw),
            Kg.RandomGaussianBlur((self.gk, self.gk), (0.1, 2.0), p=0.5*Aw),
        )
    def forward(self,x):
        return self.aug(x)
            

input_size = 224

Crop = nn.Sequential(Kg.CenterCrop(input_size))
Norm = nn.Sequential(Kg.Normalize(mean=torch.as_tensor([0.485, 0.456, 0.406]),
                                   std=torch.as_tensor([0.229, 0.224, 0.225]))
                     )             

AugS = Augmentation(input_size,Aw=1.0)
AugT = Augmentation(input_size,Aw=0.2)

normal_transform = transforms.Compose([
    transforms.ToTensor()
])

to_image_transform = transforms.Compose([
    transforms.ToPILImage()
])

数据读取

我们使用PIL来读取几张图片
如果你有一个根目录，下面有很多图片，我们可以使用secret库来随机抽取几张图来展示不同的transforms效果

img_list = glob.glob('data\\train_transformed\\*.jpg')

import secrets
num = secrets.randbelow(500)
sample_img = Image.open(img_list[num])
sample_img = normal_transform(sample_img) # 将读取的对象转化为pytorch张量

使用numpy，matplotlib来可视化


T_img = Norm(Crop(AugT(sample_img)))
S_img = Norm(Crop(AugS(sample_img)))
import numpy as np

# 输入之前我们需要将[3,224,224]的张量转化为[224,224,3]这样才会正常显示图片
npT = np.moveaxis(np.squeeze(T_img.detach().numpy()),0,-1)
npS = np.moveaxis(np.squeeze(S_img.detach().numpy()),0,-1)
org_img = np.moveaxis(np.squeeze(sample_img.detach().numpy()),0,-1)

# plt.imshow(npT)
# plt.imshow(npS)
# plt.imshow(org_img)
fig, axs = plt.subplots(1,3,figsize=(20,15))
# 显示每张图片
axs[0].imshow(npT)
axs[0].set_title("Teacher",fontsize=60)
axs[0].axis('off')  # 关闭坐标轴

axs[1].imshow(npS)
axs[1].set_title("Student",fontsize=60)
axs[1].axis('off')  # 关闭坐标轴

axs[2].imshow(org_img)
axs[2].set_title("Origin Image",fontsize=60)
axs[2].axis('off')  # 关闭坐标轴
plt.savefig(f'output{num}.jpg')
# 显示整个图像
plt.show()

效果展示

在这里插入图片描述

Dou_Huanmin

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
【深度学习图像处理】使用Kornia来更好的展示transform之后的图片

kornia是一个计算机视觉算法库，数据增强的模块非常好用，可以使用它的数据增强模块完全无缝的嵌入到pytorch中而且不会和torchvision中的transforms模块冲突以下展示我们的数据增强模块的实例。
复制链接

扫一扫