前言
这是一些对于论文《A Neural Algorithm of Artistic Style》的简单的读后总结,首先先奉上该文章的下载超链接:图像风格迁移
这篇文章是由 University of Tubingen, Germany的人员合作完成的,作者分别是Leon A. Gatys、Alexander S. Ecker和Matthias Bethge。其是图像风格迁移的来源文章,该文章使得计算机能将任意图片的风格迁移到其它图片上。
文章主要内容与贡献
该文章的贡献为:
- 提出了图像风格迁移。
提出了图像风格迁移
下图是该文章的网络结构图:
其中,该图说明了越后面的卷积层提取的特征越高级,迁移的效果越好,越全面,而前面的卷积层太关注与像素级别的特征了。
下图则说明了该网络能将任意图片的风格迁移至其他图片:
每组图像的左下角的小图皆是艺术名画,由上可知,图像风格迁移的效果十分优异,特别是图c梵高的星空。
下图则说明了不同卷积层不同迁移比例下的最终图像的结果:
最顶上的一行文字为艺术图片和自然图片的比例,由上可知卷积层较深,比例为
1
0
−
2
10^{-2}
10−2次方时的效果最佳。
损失函数
总体的损失函数公式如下:
其中α和β分别是内容和风格重构的权重因子。
内容图像的损失函数如下所示:
其中, p ⃗ \vec{p} p和 x ⃗ \vec{x} x是原始图像和生成的图像,并且 P l P^l Pl和 F l F^l Fl在 l l l层中各自的特征表示。
这个损失与层
l
l
l中的激活有关的导数等于:
Gram矩阵
G
l
∈
R
N
l
×
N
l
G^l\in R^{N_l\times{N_l}}
Gl∈RNl×Nl,其中,
G
i
j
l
G^l_{ij}
Gijl是
l
l
l层中矢量化特征映射
i
i
i和
j
j
j之间的内积:
风格重构损失具体如下所示:
其中,
a
⃗
\vec{a}
a和
x
⃗
\vec{x}
x是原图像和生成的图像,以及
A
l
A^l
Al和
G
l
G^l
Gl各自在层
l
l
l中的样式表示。
w
l
w_l
wl是每一层对总损失的贡献的加权因子。
E
l
E_l
El的导数与层
l
l
l中的激活有关,可以解析地计算: