Image Style Transfe图像风格迁移

图像风格迁移

网络模型

损失函数组成

Loss = w1 * Lc + w2 * Ls
  • Loss of content(Lc)

  • Loss of style(Ls)

Loss of content

内容图和随机噪声图经过多次卷积滤波后,conten和noise在第4层的feature map的距离的平方和

Lc

Loss of style

先对风格图和噪声图的每一层卷积得到feature map

对feature map求gram矩阵

计算两者gram距离的平方和

将5层的结果加权求和

Ls

实验图

卷积效果

随着卷积网络层数增加,获得的特征映射更加抽象。

上图可以看出,层数增高的时候:

  • 内容重构图可变化性增加,具有更大的风格变化能力。

  • 风格随着使用的层数越多,风格迁移的稳定性越强

Gram矩阵

定义

n维欧式空间中任意k个向量之间两两的内积所组成的矩阵,称为这k个向量的格拉姆矩阵*(Gram matrix)*,很明显,这是一个对称矩阵。

gram

Gram

计算

输入图像的feature map为**[ ch, h, w]**。

我们经过flatten矩阵转置操作

可以变形为**[ ch, hw][ hw, ch]**的矩阵

再对两个作内积得到Gram Matrices

理解

格拉姆矩阵可以看做feature之间的偏心协方差矩阵(即没有减去均值的协方差矩阵)

在feature map中,每个数字都来自于一个特定滤波器在特定位置的卷积,因此每个数字代表一个特征的强度

Gram计算的实际上是两两特征之间的相关性,哪两个特征是同时出现的,哪两个是此消彼长的等等。

因为为乘法操作 两两特征同时为高 结果才高

格拉姆矩阵用于度量各个维度自己的特性以及各个维度之间的关系

内积之后得到的多尺度矩阵中:

  • 对角线元素提供了不同特征图各自的信息

  • 其余元素提供了不同特征图之间的相关信息。这样一个矩阵,既能体现出有哪些特征,又能体现出不同特征间的紧密程度

gram矩阵是计算每个通道 i 的feature map与每个通道 j 的feature map的内积

gram matrix的每个值可以说是代表 I 通道的feature map与 j 通道的feature map的互相关程度

参考链接

  • https://www.cnblogs.com/yifanrensheng/p/12862174.html
  • https://blog.csdn.net/weixin_40759186/article/details/87804316
  • https://www.cnblogs.com/subic/p/8110478.html
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值