##17 深入理解生成对抗网络（GANs）：PyTorch实现基础

是阿牛啊

于 2024-05-13 08:45:00 发布

阅读量884

点赞数 12

分类专栏：大数据挖掘数据分析 Python机器学习编程文章标签： pytorch 逻辑回归 python 生成对抗网络深度学习人工智能神经网络

本文链接：https://blog.csdn.net/weixin_51352614/article/details/138427874

版权

大数据挖掘同时被 3 个专栏收录

85 篇文章 1 订阅

订阅专栏

数据分析

62 篇文章 0 订阅

订阅专栏

Python机器学习编程

61 篇文章 2 订阅

订阅专栏

文章目录

前言

前言

生成对抗网络（GANs），自2014年由Ian Goodfellow及其同事提出以来，已经成为深度学习领域最具革命性的创想之一。GANs强大的生成能力使其在图像生成、视频游戏、艺术创作等多个领域显示出巨大的应用潜力。本文将深入探讨GANs的基本概念、工作原理及如何在PyTorch中实现一个基础的GAN模型。
在这里插入图片描述

什么是生成对抗网络（GANs）？

生成对抗网络是一种特殊的构架，主要由两部分组成：生成器（Generator）和判别器（Discriminator）。生成器的任务是产生尽量逼真的数据来“欺骗”判别器，而判别器的任务则是区分生成的数据和真实的数据。这两个网络在训练过程中相互博弈，不断提升自身的性能。

生成器（Generator）

生成器是一个网络，它接受随机的噪声信号作为输入，并输出数据。其目标是生成足够真实的数据，以至于判别器无法区分真伪。

判别器（Discriminator）

判别器是另一个网络，它的输入是数据（可以是真实的，也可以是生成器生成的），输出是数据为真实数据的概率。判别器的目标是正确识别出真实数据和生成数据。

GANs的工作原理

GANs的训练过程是一个动态的博弈过程，其中生成器和判别器有着相反的目标。这一过程可以通过以下步骤概括：

训练判别器：用真实数据和生成器生成的假数据训练判别器，目标是最大化其在两者之间做出正确判断的能力。
训练生成器：固定判别器，只训练生成器，使其生成的假数据尽可能“欺骗”判别器，即让判别器判断为真的概率最大化。

这个过程需要反复进行，直至生成器和判别器达到某种动态平衡。

在PyTorch中实现GAN

接下来，我们将使用PyTorch框架来实现一个简单的GAN模型。这个模型将学习生成与MNIST手写数字数据集类似的数字图像。

环境设置

首先，确保安装了PyTorch及相关库：

pip install torch torchvision

构建模型

我们需要定义生成器和判别器。这里使用简单的全连接网络作为示例：

import torch
import torch.nn as nn

class Generator(nn.Module):
    def __init__(self, input_dim, output_dim):
        super(Generator, self).__init__()
        self.fc = nn.Sequential(
            nn.Linear(input_dim, 256),
            nn.LeakyReLU(0.2),
            nn.Linear(256, 512),
            nn.LeakyReLU(0.2),
            nn.Linear(512, 1024),
            nn.LeakyReLU(0.2),
            nn.Linear(1024, output_dim),
            nn.Tanh()
        )

    def forward(self, x):
        return self.fc(x)

class Discriminator(nn.Module):
    def __init__(self, input_dim):
        super(Discriminator, self).__init__()
        self.fc = nn.Sequential(
            nn.Linear(input_dim, 1024),
            nn.LeakyReLU(0.2),
            nn.Dropout(0.3),
            nn.Linear(1024, 512),
            nn.LeakyReLU(0.2),
            nn.Dropout(0.3),
            nn.Linear(512, 256),
            nn.LeakyReLU(0.2),
            nn.Dropout(0.3),
            nn.Linear(256, 1),
            nn.Sigmoid()
        )

    def forward(self, x):
        return self.fc(x)

训练模型

训练过程涉及到交替训练判别器和生成器：

import torch.optim as optim
import torchvision.datasets as dset
import torchvision.transforms as transforms
from torch.utils.data import DataLoader

# 超参数设置
batch_size = 128
lr = 0.0002
epochs = 50
nz = 100  # 噪声维度
ngf = 28 * 28  # 生成器输出图像维度

# 数据加载器
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))
])
mnist_data = dset.MNIST(root='./data', train=True, download=True, transform=transform)
dataloader = DataLoader(mnist_data, batch_size=batch_size, shuffle=True)

# 模型初始化
netG = Generator(nz, ngf).to(device)
netD = Discriminator(ngf).to(device)
optimizerD = optim.Adam(netD.parameters(), lr=lr)
optimizerG = optim.Adam(netG.parameters(), lr=lr)

# 损失函数
criterion = nn.BCELoss()

# 训练循环
for epoch in range(epochs):
    for i, data in enumerate(dataloader, 0):

        # 更新判别器网络
        netD.zero_grad()
        real_data = data[0].view(-1, 28*28).to(device)
        label = torch.full((batch_size,), 1, dtype=torch.float, device=device)
        output = netD(real_data)
        errD_real = criterion(output, label)
        errD_real.backward()
        D_x = output.mean().item()

        noise = torch.randn(batch_size, nz, device=device)
        fake_data = netG(noise)
        label.fill_(0)
        output = netD(fake_data.detach())
        errD_fake = criterion(output, label)
        errD_fake.backward()
        D_G_z1 = output.mean().item()
        errD = errD_real + errD_fake
        optimizerD.step()

        # 更新生成器网络
        netG.zero_grad()
        label.fill_(1)
        output = netD(fake_data)
        errG = criterion(output, label)
        errG.backward()
        D_G_z2 = output.mean().item()
        optimizerG.step()

        if i % 100 == 0:
            print(f'Epoch [{epoch+1}/{epochs}] Batch [{i}/{len(dataloader)}] Loss D: {errD.item()}, Loss G: {errG.item()}')

print("训练完成")

结果分析

通过上述训练过程，我们可以观察到生成器和判别器的损失变化，这有助于我们理解GANs训练的动态平衡。最终，生成器应能产生越来越真实的手写数字图像。

总结

生成对抗网络（GANs）是一个非常有趣且具有挑战性的研究领域，它为我们提供了一个通过对抗过程生成高质量数据的框架。虽然本文中介绍的GAN模型比较基础，但它是理解和掌握GANs核心概念的良好起点。希望这篇文章能帮助你开始自己的GANs探索之路。

是阿牛啊

关注

12
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
##17 深入理解生成对抗网络（GANs）：PyTorch实现基础

生成对抗网络（GANs），自2014年由Ian Goodfellow及其同事提出以来，已经成为深度学习领域最具革命性的创想之一。GANs强大的生成能力使其在图像生成、视频游戏、艺术创作等多个领域显示出巨大的应用潜力。本文将深入探讨GANs的基本概念、工作原理及如何在PyTorch中实现一个基础的GAN模型。生成对抗网络是一种特殊的构架，主要由两部分组成：生成器（Generator）和判别器（Discriminator）。
复制链接

扫一扫

专栏目录