风格迁移VGG-Loss之Gram matrix

最新推荐文章于 2025-03-13 16:45:38 发布

Som5ra

最新推荐文章于 2025-03-13 16:45:38 发布

阅读量3.8k

点赞数 2

文章标签：线性代数矩阵深度学习

本文链接：https://blog.csdn.net/weixin_44061744/article/details/121628990

版权

风格迁移通过VGG网络利用Gram矩阵衡量图像特征间的相关性。计算Gram矩阵是将特征图转换成矩阵并与其转置做内积，表示特征之间的相关度。在风格迁移中，通过最小化基准图像与风格图像Gram矩阵的差异来调整图像，使其风格接近目标。浅层特征捕捉细节，深层特征捕获抽象信息，组合形成图像风格。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

风格迁移VGG-Loss之Gram matrix

定义
计算和特征表示
在风格迁移里的应用

source:
https://www.cnblogs.com/yifanrensheng/p/12862174.html
https://medium.com/@oleksandrsavsunenko/content-and-style-loss-using-vgg-network-e810a7afe5fc

定义

n维欧式空间中任意k个向量之间两两内积所组成的矩阵，称为这k个向量的格拉姆矩阵(Gram matrix)，很明显，这是一个对称矩阵。

计算和特征表示

如果把[channel, h, w]的feature map转换为[channel, h * w]的矩阵，然后与自己的转置矩阵做内积，那么就得到了Gram matrix；由于内积表示两个向量的相关度，所以Gram matrix可以表示自己的特征矩阵中，channel $_i$ 和 channel $_j$