PyTorch实战（4）---- 图片类型迁移

最新推荐文章于 2024-07-09 10:57:56 发布

Grin*

最新推荐文章于 2024-07-09 10:57:56 发布

阅读量172

点赞数

分类专栏： PyTorch 文章标签：深度学习 pytorch

本文链接：https://blog.csdn.net/gpx33333/article/details/104269782

版权

PyTorch 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

图片类型迁移

from __future__ import division
from torchvision import models, transforms
from PIL import Image
import argparse
import torch
import torchvision
import torch.nn as nn
import numpy as np

import matplotlib.pyplot as plt

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406],
                        std=[0.229, 0.224, 0.225])
])

# 读入图片函数
def load_image(image_path, transform=None, max_size=None, shape=None):
    image = Image.open(image_path)
    if max_size:
        scale = max_size / max(image.size)
        size = np.array(image.size) * scale
        image = image.resize(size.astype(int), Image.ANTIALIAS)
    if shape:
        image = image.resize(shape, Image.LANCZOS)
    if transform:
        image = transform(image).unsqueeze(0)
    return image.to(device)

# 读取两张图片
content = load_image("image/content.jpg", transform, max_size=400)
style = load_image("image/style.jpg", transform, shape=[content.size(2), content.size(3)])

# print(content.shape, style.shape)

# 定义一个抽feature的module
class VGGNet(nn.Module):
    def __init__(self):
        super(VGGNet, self).__init__()
        self.select = ['0', '5', '10', '19', '28']
        self.vgg = models.vgg19(pretrained=True).features
    def forward(self, x):
        features = []
        for name, layer in self.vgg._modules.items():
            x = layer(x)
            if name in self.select:
                features.append(x)
        return features

# 定义一个抽feature的model
vgg = VGGNet().to(device).eval()

features = vgg(content)

# 展示一下抽取出feature的维度
for feat in features:
    print(feat.shape)

target = content.clone().requires_grad_(True)
optimizer = torch.optim.Adam([target], lr=0.003, betas=[0.5, 0.999])

# 更新target image
num_steps = 2000
for step in range(num_steps):
    target_features = vgg(target)
    content_features = vgg(content)
    style_features = vgg(style)
    
    content_loss = style_loss = 0.
    for f1, f2, f3 in zip(target_features, content_features, style_features):
        content_loss += torch.mean((f1-f2)**2)
        _, c, h, w = f1.size()
        f1 = f1.view(c, h*w)
        f3 = f3.view(c, h*w)
        
        f1 = torch.mm(f1, f1.t())
        f3 = torch.mm(f3, f3.t())
        style_loss += torch.mean((f1-f3)**2) / (c*h*w)
    
    loss = content_loss + style_loss * 100

    # 更新target image的Tensor
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

    if step % 100 == 0:
        print("Step [{}/{}], Content Loss: {:.4f}, Style Loss: {:.4f}, Total Loss: {:.4f}"
             .format(step, num_steps, content_loss, style_loss, loss))

Grin*

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PyTorch实战（4）---- 图片类型迁移

图片类型迁移from __future__ import divisionfrom torchvision import models, transformsfrom PIL import Imageimport argparseimport torchimport torchvisionimport torch.nn as nnimport numpy as npimport...
复制链接

扫一扫