pytorch代码实践--风格迁移

最新推荐文章于 2022-01-08 13:06:22 发布

whyyyfff

最新推荐文章于 2022-01-08 13:06:22 发布

阅读量271

点赞数

分类专栏： nlp 文章标签： pytorch

本文链接：https://blog.csdn.net/qq_41950261/article/details/111687426

版权

nlp 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

导入包，加载数据

from __future__ import division
from torchvision import models, transforms
from PIL import Image
import argparse
import torch
import torchvision
import torch.nn as nn
import numpy as np

import matplotlib.pyplot as plt

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

def load_image(image_path,transform=None, max_size=None, shape=None):
    image = Image.open(image_path)
    if max_size:
        scale = max_size/max(image.size)
        size = np.array(image.size)*scale
        image = image.resize(size.astype(int), Image.ANTIALIAS)

    if shape:
        image = image.resize(shape, Image.LANCZOS)

    if transform:
        image=transform(image).unsqueeze(0)

    return image.to(device)


transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485,0.456,0.406],
                         std=[0.229,0.224,0.225])
])

content = load_image('png/content.png',transform,max_size=400)
style = load_image('png/style.png',transform,shape=[content.size(2),content.size(3)])

unloader = transforms.ToPILImage()

plt.ion()               #??????????????????????

def imshow(tensor, title=None):
    image = tensor.cpu().clone()
    image=image.squeeze()
    image = unloader(image)
    plt.imshow(image)
    if title is not None:
        plt.title(title)
    plt.pause(0.001)

plt.figure()
imshow(style[0],title=Image)

定义模型

class VGGNet(nn.Module):
    def __init__(self):
        super(VGGNet, self).__init__()
        self.select = ['0','5','10','19','28']
        self.vgg = models.vgg19(pretrained = True).features

    def forward(self,x):
        features = []
        for name, layer in self.vgg._modules.items():
            x = layer(x)
            if name in self.select:
                features.append(x)
        return features

开始训练

target = content.clone().requires_grad_(True)
optimizer = torch.optim.Adam([target],lr=0.003, betas=[0.5,0.999])      # 优化的的 target 的特征向量
vgg = VGGNet().to(device).eval

target_feature = vgg(target)
total_step = 2000
style_weight = 100
for step in range(total_step):
    target_feature = vgg(target)
    content_feature = vgg(content)
    style_feature = vgg(style)

    style_loss = 0
    content_loss =0
    for f1, f2, f3 in zip(target_feature,content_feature,style_feature):

        content_loss += torch.mean((f1-f2)**2)

        _, c, h, w = f1.size()
        f1 = f1.view(c,h*w)
        f3 = f3.view(c,h*w)
        f1 = torch.mm(f1,f1.t())
        f3 = torch.mm(f3,f3.t())
        style_loss += torch.mean((f1-f3)**2)/(c*h*w)

    loss = content_loss + style_weight * style_loss

    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

    if step % 100 == 0:
        print('step {}/{}, content loss: {:.4f}, style loss: {:.4f}, '.format(step,total_step,
                                                                              content_loss.item(),style_loss.item()))

测试一下效果

denorm = transforms.Normalize((-2.12, -2.04, -1.80),(4.37, 4.46, 4.44))
img = target.clone().squeeze()          # target为模型训练到最后的优化参数
img = denorm(img).clamp_(0,1)
plt.figure()
imshow(img, title='target image')

whyyyfff

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
pytorch代码实践--风格迁移

导入包，加载数据from __future__ import divisionfrom torchvision import models, transformsfrom PIL import Imageimport argparseimport torchimport torchvisionimport torch.nn as nnimport numpy as npimport matplotlib.pyplot as pltdevice = torch.device('cu
复制链接

扫一扫

专栏目录