大体思路:
风格迁移网络总共分为三部分主干网络VGG、内容损失函数Li=2∗M∗N1ij∑(Xij−Pij)2 、风格损失函数Li=4∗M2∗N21ij∑(Gij−Aij)2、
主干网络VGG:
主干网络为对抗生成网络,主要负责1、提取图片的风格和内容(目标图片和样式图片) 2、生成与目标图片内容一样并且和样式图片风格一样的图片。
内容损失函数:
计算内容损失:内容图片在指定层上提取出的特征矩阵,与噪声图片在对应层上的特征矩阵的差值的L2范数。即求两两之间的像素差值的平方。
Li=2∗M∗N1ij∑(Xij−Pij)2
对应每一层的内容损失函数:
其中,X是噪声图片的特征矩阵,P是内容图片的特征矩阵。M是P的长*宽,N是信道数。
最终的内容损失为,每一层的内容损失加权和,再对层数取平均。
风格损失函数
我们使用风格图像在指定层上的特征矩阵的GRAM矩阵来衡量其风格,风格损失可以定义为风格图像和噪音图像特征矩阵的格莱姆矩阵的差值的L2范数。
对于每一层的风格损失函数: 4∗M2∗N21ij∑(Gij−Aij)2
其中M是特征矩阵的长*宽,N是特征矩阵的信道数。G为噪音图像特征的Gram矩阵,A为风格图片特征的GRAM矩阵。
最终的风格损失为,每一层的风格损失加权和,再对层数取平均。