StyleBank 学习小记：一个可以分离风格与内容的图像风格转换器

最新推荐文章于 2022-07-28 14:26:58 发布

Jiachen Yu

最新推荐文章于 2022-07-28 14:26:58 发布

阅读量3.9k

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/dpppBR/article/details/78794733

版权

本文详述StyleBank的工作原理，包括网络结构、训练策略和特性。StyleBank通过分离内容与风格，实现图像风格转换。它使用Encoder、Decoder和StyleBank Layer，以保留内容并学习多种风格。训练策略涉及身份损失、VGG-16网络和Gram Matrix。StyleBank支持增量学习，适用于风格融合等场景。

摘要由CSDN通过智能技术生成

实现代码：https://github.com/yjc567/StyleBank

本文是对文章 StyleBank: An Explicit Representation for Neural Image Style Transfer 的整理，以及自己重现其实验的结果和查阅相关资料的记录。

大纲

本文的大体内容分为以下几点：

StyleBank的网络结构
StyleBank的训练策略
StyleBank的特性与优点
StyleBank的参数调整对实验结果的影响
训练结果分析
Instance normalization简介
Total Variation（TV）loss简介
将VGG net用于特征抽取，以及Gram Matrix 简介
对FRIQA和SSIM两个图像质量评价方法的介绍
反思
参考文献

因为时间有限，加上自己的实验还没有完全结束。所以本文着重于讲述[1, 2, 6, 7, 8]这几个偏向理论的部分，其余部分留在下一次的实验报告中提交

StyleBank的网络结构

网络结构

图片编码器（image encoder） $\mathcal{E}$ 。
StyleBank层（StyleBank layer） $\mathcal{K}$ ，其中包括 $n$ 个并行的过滤器（filter，在本文中，使用cnn作为filter） ${\lbrace K_i \rbrace},(i = 1, 2, \ldots,n)$ ，对应n个不同的风格。
图片解码器（image decoder） $\mathcal{D}$ 。