pytorch实战-7图像风格迁移

新世纪摸鱼战士678

已于 2024-01-25 03:15:22 修改

阅读量2.5k

点赞数 27

文章标签： pytorch 人工智能 python

于 2024-01-23 01:54:42 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/peter6768/article/details/135738503

版权

1 什么是风格迁移

how to：还是cnn，输入是图像，输出和上一章相比，不是数字，而是图像。

意义：给一张图像输入，可以输出指定风格化处理的图像

2 风格迁移发展简史

早期针对图像局部特征（纹理生成）或特定风格/场景建立模型，迁移时通过套用模型提取图片纹理或转化风格。缺点是特征/风格单一，无法通用。

2015 lero gatys尝试用神经网络做风格迁移，效果很好，并成为了主流。神经网络做风格迁移前，主要有纹理生成，特定风格等技术

2.1 纹理生成

此种风格迁移是将物体表面的纹理特征作为风格，赋予其他图像

早期纹理生成方法可分为3类：纹理映射，过程纹理合成，基于样图的纹理生成

纹理映射：

过程纹理合成：计算机模拟物体表面纹理直接生成

基于样图纹理生成：基于小区域样图，按表面几何形状，拼接生成整个图像。适用于给图像填补缺陷

2.2 特定风格实现

针对每种风格设计一种算法，对待处理的图像应用算法，将特定风格赋予图像。缺点是麻烦，每种风格需设计一种算法

3 神经网络风格迁移

3.1 优势

1 特征提取维度更多，比人为设算法可能覆盖面更大 2 无需为每种风格设置特定算法，一个网络可以提取很多风格

3.2 基本思想

风格迁移不是每个像素的一致，而是整体特征，整体特征可由特征图体现，特征图又由卷积核决定，所以风格迁移里风格主要影响因素是卷积核。总体来说，保持风格迁移的同时，还要保证图像一定的内容相似度

3.3 卷积神经网络的选取

目标：选取适合做风格迁移的神经网络

如何选取：因为衡量尺度有多个（内容准确度和风格相似度），可据此选取在分类问题表现良好的大型网络，一种常用的网络是牛津视觉几何组提出的VGG网络。

特点：和前述章节cnn相比，VGG卷积核较小(3x3)且网络较深。对于VGG，当固定其他参数时，逐步加深网络，网络的识别能力也会逐步提高，且有良好泛化能力。

举例：VGG19有16个卷积层和3个全连接层，16个卷积层分为5组，每组是2个或4个连续的卷积层。每组卷积层大小不变，是因为对于3x3卷积核用了padding=1

3.4 内容损失

第四组的第一层卷积层的输出对内容准确度可以有较好的体现，因此，将图像输入，将第四组第一层卷积网络输出做均方误差作为loss表示图像准确度

3.5 风格损失

风格损失可理解为特征图之间的相关性：即包括同一层特征图之间相关性，也包含不同层里的特征图的相关性，可用Gram矩阵表示。gram矩阵定义为同一层两个特征图的内积。风格损失可用gram矩阵的均方误差表示

3.6 风格损失原理分析

如果两个图像长得像但风格不同，那么gram矩阵会很不同但第四层特征图均方误差相近

如果两个风格相同的图但内容很不一样，那么gram矩阵会很接近但第四层特征图均方误差很不一样

3.7 风格迁移损失函数优化

综合loss可通过内容损失和风格损失加权体现，参数通过训练寻找最优。训练过程不会改变神经网络参数，只会改变加权的权重参数

4 案例

4.1 准备工作

主要包括导入模块，准备数据，数据预处理等操作

from __future__ import print_function

import os.path
import copy
impo

最低0.47元/天解锁文章

新世纪摸鱼战士678

博客等级

码龄7年

125
原创

823
点赞

666
收藏

627
粉丝

关注

私信

热门文章

分类专栏

linux 7篇
docker 7篇
全栈 2篇
k8s 1篇

展开全部收起

上一篇：: pytorch实战-6手写数字加法机-迁移学习

下一篇：: pytorch实战-图像生成与对抗

最新评论

pycodebook学习笔记_数据结构和算法
普通网友: 文章结构严谨有条,层次分明,读起来一点也不费劲，让人受益匪浅。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
流畅的python-学习笔记_设计模式+装饰器+闭包
普通网友: 引领技术潮流，是不可多得的好文，十分值得借鉴和参考。期待博主未来能够持续分享更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
流畅的python-学习笔记_对象引用、可变性、垃圾回收
普通网友: 文章内容通俗易懂，适合不同层次的读者。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
流畅的python-学习笔记_序列
普通网友: 写的真好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
深度学习入门-斋藤
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。