昇思25天学习打卡营第13天|CycleGAN 图像风格迁移互换全流程解析

前端基地

已于 2024-07-16 13:07:52 修改

阅读量543

点赞数 28

分类专栏： AI实验室文章标签：人工智能神经网络机器学习深度学习 python numpy CycleGAN

于 2024-07-16 11:15:47 首次发布

本文链接：https://blog.csdn.net/chinayun_6401/article/details/140460340

版权

数据集下载和加载

使用 download 接口下载数据集，并将下载后的数据集自动解压到当前目录下。数据下载之前需要使用 pip install download 安装 download 包。使用 MindSpore 的 MindDataset 接口读取和解析数据集。

代码如下：

%%capture captured_output  
# 实验环境已经预装了mindspore==2.2.14，如需更换mindspore版本，可更改下面mindspore的版本号  
!pip uninstall mindspore -y  
!pip install -i https://pypi.mirrors.ustc.edu.cn/simple mindspore==2.2.14  
# 查看当前 mindspore 版本  
!pip show mindspore  
from download import download  
url = "https://mindspore-website.obs.cn-north-4.myhuaweicloud.com/notebook/models/application/CycleGAN_apple2orange.zip"  
download(url, ".", kind="zip", replace=True)  
from mindspore.dataset import MindDataset  
# 读取MindRecord格式数据  
name_mr = "./CycleGAN_apple2orange/apple2orange_train.mindrecord"  
data = MindDataset(dataset_files=name_mr)  
print("Datasize: ", data.get_dataset_size())  
batch_size = 1  
dataset = data.batch(batch_size)  
datasize = dataset.get_dataset_size()

分析：首先，对已安装的 MindSpore 库进行卸载尝试。紧接着，通过特定的镜像源安装指定版本（2.2.14）的 MindSpore 库。最后，查看当下所安装的 MindSpore 版本。

从指定的 URL 下载一个 zip 压缩文件至当前目录，同时指定若存在同名文件则予以替换。

从 MindSpore 的 dataset 模块导入 MindDataset 类，之后指定一个名为 name_mr 的路径用于读取 MindRecord 格式的数据，并将其存储于 data 变量内，最终打印出此数据集的规模大小。

设置批量大小为 1，对原始数据集进行批量处理，将处理后的数据集存于 dataset 变量中，最后获取处理后的数据集的大小并存储在 datasize 变量里。

可视化

通过 create_dict_iterator 函数将数据转换成字典迭代器，然后使用 matplotlib 模块可视化部分训练数据。从 dataset 中读取前 5 组图像数据，对其进行处理，并以特定的布局在一个图形中展示这些图像。

代码如下：

import numpy as np  
import matplotlib.pyplot as plt  
mean = 0.5 * 255  
std = 0.5 * 255  
plt.figure(figsize=(12, 5), dpi=60)  
for i, data in enumerate(dataset.create_dict_iterator()):  
    if i < 5:  
        show_images_a = data["image_A"].asnumpy()  
        show_images_b = data["image_B"].asnumpy()  
  
        plt.subplot(2, 5, i+1)  
        show_images_a = (show_images_a[0] * std + mean).astype(np.uint8).transpose((1, 2, 0))  
        plt.imshow(show_images_a)  
        plt.axis("off")  
  
        plt.subplot(2, 5, i+6)  
        show_images_b = (show_images_b[0] * std + mean).astype(np.uint8).transpose((1, 2, 0))  
        plt.imshow(show_images_b)  
        plt.axis("off")  
    else:  
        break  
plt.show()

分析：首先，导入了 numpy 库并简称为 np ，同时引入了 matplotlib 库的 pyplot 模块以用于绘图。

接着，定义了两个变量 mean 和 std ，它们将服务于后续的数据处理工作。

之后，创建了一个新的图形，将其大小设定为 (12, 5) ，分辨率设为 60 。

随后，运用 enumerate 函数对 dataset 的 create_dict_iterator 所生成的迭代器进行遍历。对于前面的 5 个数据项，如果索引 i 小于 5 ，就从数据中提取 image_A 和 image_B 并转换为 numpy 数组。而后对这些图像数据进行一系列处理，包含乘以 std 再加上 mean ，进行类型转换以及维度变换。使用 plt.subplot 在图形里创建子图，并于子图中展示处理后的图像，同时关闭坐标轴。一旦索引超过 4 ，就退出循环。

最终，显示绘制好的图形。

运行结果：

构建生成器

首先，导入了 mindspore.nn 模块，并简称为 nn ；导入了 mindspore.ops 模块，并简称为 ops ；还从 mindspore.common.initializer 中引入了 Normal 以用于权重的初始化，并设定了一种权重初始化方式 weight_init 。

定义了一个名为 ConvNormReLU 的类，该类继承自 nn.Cell 。此类别旨在构建涵盖卷积、归一化以及激活函数的层。在 __init__ 方法里，完成了各类参数的设定以及层的初始化操作，在 construct 方法中明确了前向传播的计算逻辑。

定义了 ResidualBlock 类，用于构建残差块。它包含了两个 ConvNormReLU 层，并且能够选择是否运用 Dropout 。

定义了 ResNetGenerator 类，这是一个基于残差网络的生成器。在 __init__ 方法中搭建了网络的各个层级，在 construct 方法中确定了前向传播的流程。

再次强调，定义的 ResNetGenerator 类是一个基于残差网络的生成器，在 __init__ 方法中构建了网络的各层结构，在 construct 方法中定义了前向传播的流程。

最后，实例化了两个 ResNetGenerator 对象，分别为 net_rg_a 和 net_rg_b ，并分别对它们的参数名称进行了更新。

代码如下：

import mindspore.nn as nn  
import mindspore.ops as ops  
from mindspore.common.initializer import Normal  
weight_init = Normal(sigma=0.02)  
class ConvNormReLU(nn.Cell):  
    def __init__(self, input_channel, out_planes, kernel_size=4, stride=2, alpha=0.2, norm_mode='instance',  
                 pad_mode='CONSTANT', use_relu=True, padding=None, transpose=False):  
        super(ConvNormReLU, self).__init__()  
        norm = nn.BatchNorm2d(out_planes)  
        if norm_mode == 'instance':  
            norm = nn.BatchNorm2d(out_planes, affine=False)  
        has_bias = (norm_mode == 'instance')  
        if padding is None:  
            padding = (kernel_size - 1) // 2  
        if pad_mode == 'CONSTANT':  
            if transpose:  
                conv = nn.Conv2dTranspose(input_channel, out_planes, kernel_size, stride, pad_mode='same',  
                                          has_bias=has_bias, weight_init=weight_init)  
            else:  
                conv = nn.Conv2d(input_channel, out_planes, kernel_size, stride, pad_mode='pad',

最低0.47元/天解锁文章

前端基地

关注

28
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
昇思25天学习打卡营第13天|CycleGAN 图像风格迁移互换全流程解析

通过 create_dict_iterator 函数将数据转换成字典迭代器，然后使用 matplotlib 模块可视化部分训练数据。从 dataset 中读取前 5 组图像数据，对其进行处理，并以特定的布局在一个图形中展示这些图像。
复制链接

扫一扫