目录
前言:
神经风格迁移是指一幅画提供内容(c),一幅画提供风格(s),然后生成一幅新的图像(G)
代价函数(Cost function)
神经风格迁移算法的概要,定义一个生成图片G的代价函数,并将其最小化
其实只需要一个超参数就行,但提出神经风格迁移的作者使用了两个超参数。
训练过程:先随机生成一个G的图像,然后对G梯度下降,即 ,在这个步骤中,实际上更新的是图像G的像素值。
(1是C图,2是S图,3是随机生成的G图,4,5,6是更新像素值后的G图)
内容代价函数(content cost function)
这个网络层 通常会选择在网络的中间层,即不太浅也不太深。
如果两个图片在网络层 激活函数值相似,那么意味着这两个图片的内容相似。
取 层的隐含单元的激活值,按元素相减,,然后取平方,也可以在前面加上归一化,比如 ,不过都影响不大,因为这都可以由这个超参数α来调整。
风格代价函数(style cost function)
图片的风格定义为第l层输出的feature maps中各个通道之间激活项的相关系数。
可以计算出风格图片(S)和 生成图片(G) 的 各个通道之间的相关系数,从而判断两个图片的风格是否相似
下图举例5个通道
i ,j ,k 分别代表该位置的高度、宽度以及对应的通道数。
定义一个关于 层和风格图像的矩阵,即 ( 表示层数,S 表示风格图像),是一个 的矩阵。
公式翻译:k号通道和k’号通道的每个元素对应相乘,最后相加。严格来说,它是一种非标准的互相关函数,因为没有减去平均数,而是将它们直接相乘。
对于风格矩阵,就是计算这个矩阵也就是 矩阵,因为这里有 个通道,所以计算完每个通道和每个通道之间的非标准互相关系数,就是 的矩阵。
分别计算风格图像(S)和生成图像(G)的Frobenius范数,这实际上是计算两个矩阵对应元素相减的平方的和,然后外面乘了一个归一化常数。
不规范总结
内容是元素的值,风格是不同通道之间的相关系数。