【论文笔记】《Self-Attention Generative Adversarial Networks》

最新推荐文章于 2023-12-29 15:26:33 发布

puchapu

最新推荐文章于 2023-12-29 15:26:33 发布

阅读量1.5k

点赞数

分类专栏： GAN attention 文章标签：论文

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/puchapu/article/details/89575098

版权

GAN 同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

摘要：在本文中，我们提出了自注意生成对抗网络(SAGAN)，它允许对图像生成任务进行注意力驱动的长期依赖关系建模。在低分辨率feature map中，传统的卷积GANs只根据空间局部点来生成高分辨率细节。在SAGAN中，可以使用来自所有特征位置的线索生成细节。此外，鉴别器还可以检查图像中较远部分的细节特征是否一致。此外，最近的工作表明，生成器影响GAN的表现，我们对G使用频谱归一化。达到了state of the art。

问题：有一些类别难以通过建模进行合成。GAN擅长于合成结构约束少的类别，难以捕捉几何和结构模式。

一个可能的解释是，以前的模型严重依赖卷积来对不同图像区域之间的依赖关系进行建模。

卷积操作主要处理邻近区域的信息，对图片中的远距离依赖难以进行有效建模。
本文提出Self-attention GAN使得g和d均可以对空间上间隔很远的区域进行关系建模。

首先，隐含层特征分别映射到不同的特征空间f，g
在这里插入图片描述
计算权重（模型在合成j区域的时候对i区域的关注程度）

进一步，注意力层的输出为

其中：

权重Wf，Wg，Wh进行卷积核大小为1*1的卷积操作

其中：

feature map每一块加上注意力map乘以尺度系数。

开始的y设置为0，这样网络可以更多关注邻近的区域，然后进一步将权重分配给非邻近的线索。
逐步的增加任务的复杂度。将注意力机制用在G和D上，通过对抗所示交替训练。
在这里插入图片描述
稳定GAN训练的方法
1.使用频谱归一化作用在G和D
2.双时间尺度更新规则，可以解决正则化D是训练缓慢的问题

1中，这样做通过限制每一层的频谱范数来约束鉴别器的Lipschitz常数，不需要额外训练超参数（实际中所有层的频谱范数设置为1）

2中，传统对于D的正则需要对D进行多次更新。在相同时间下得到更好的结果。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【论文笔记】《Self-Attention Generative Adversarial Networks》

在本文中，我们提出了自注意生成对抗网络(SAGAN)，它允许对图像生成任务进行注意力驱动的长期依赖关系建模。在低分辨率feature map中，传统的卷积GANs只根据空间局部点来生成高分辨率细节。在SAGAN中，可以使用来自所有特征位置的线索生成细节。此外，鉴别器还可以检查图像中较远部分的细节特征是否一致。此外，最近的工作表明，生成器影响GAN的表现，我们对G使用频谱归一化。达到了state of the art。
复制链接

扫一扫

专栏目录

目录

分类专栏

Latex 2篇
GAN 1篇
attention 1篇
源码 1篇
DA 1篇
论文 3篇

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。